Hive 数据迁移与备份

本文详细介绍了Hive数据迁移的方法,包括使用import和export工具同时迁移表及其数据、分步迁移表和数据的过程,以及迁移步骤的具体操作命令。此外,还提供了在不同场景下(如HDFS集群是否连通)的数据迁移策略。

迁移类型

  1. 同时迁移表及其数据(使用importexport
  2. 分步迁移表和数据
    1. 迁移表(show create table <tab_name>
    2. 迁移数据
    3. 关联表和数据(msck repair

迁移步骤

  1. 将表和数据从 Hive 导出到 HDFS
  2. 将表和数据从 HDFS 导出到本地服务器
  3. 将表和数据从本地服务器复制到目标服务器
  4. 将表和数据从目标服务器上传到目标 HDFS
  5. 将表和数据从目标 HDFS 上传到目标 Hive 库
  • 如果原始 HDFS 和目标 HDFS 集群连通,可使用 DiskCP 工具直接跨集群复制,而跳过2~4步

实施过程

目标集群和服务器检查

df -lh # 查看本地空间使用情况
hadoop dfsadmin -report # 查看HDFS集群使用情况
hadoop fs -find / -name warehouse # 查找Hive库位置
hadoop fs -du -h /user/hive/warehouse # 查看Hiv
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值