迁移类型
- 同时迁移表及其数据(使用
import和export) - 分步迁移表和数据
- 迁移表(
show create table <tab_name>) - 迁移数据
- 关联表和数据(
msck repair)
- 迁移表(
迁移步骤
- 将表和数据从 Hive 导出到 HDFS
- 将表和数据从 HDFS 导出到本地服务器
- 将表和数据从本地服务器复制到目标服务器
- 将表和数据从目标服务器上传到目标 HDFS
- 将表和数据从目标 HDFS 上传到目标 Hive 库
- 如果原始 HDFS 和目标 HDFS 集群连通,可使用
DiskCP工具直接跨集群复制,而跳过2~4步

实施过程
目标集群和服务器检查
df -lh # 查看本地空间使用情况
hadoop dfsadmin -report # 查看HDFS集群使用情况
hadoop fs -find / -name warehouse # 查找Hive库位置
hadoop fs -du -h /user/hive/warehouse # 查看Hiv

本文详细介绍了Hive数据迁移的方法,包括使用import和export工具同时迁移表及其数据、分步迁移表和数据的过程,以及迁移步骤的具体操作命令。此外,还提供了在不同场景下(如HDFS集群是否连通)的数据迁移策略。

1346

被折叠的 条评论
为什么被折叠?



