大数据同步工具sqoop的上手操作

本文详细介绍了如何在Linux环境下安装和配置Sqoop,包括下载安装包、修改配置文件、拷贝JDBC驱动、验证配置以及测试连接数据库。此外,还讲解了数据同步的策略,如全量表、增量表、新增及变化表、特殊表,并提供了一个用于从MySQL导入数据到Hadoop的bash脚本示例。最后,文章强调了在数据迁移过程中保持数据一致性的重要性。

sqoop的上手操作

1.sqoop安装调试

1, 下载并解压
1)下载地址:http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/
2)上传安装包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz到hadoop12的/opt/soft路径中
3)解压sqoop安装包到指定目录,如:
[xian@hadoop12 software]$ tar -zxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/app/
4)解压sqoop安装包到指定目录,如:
[xian@hadoop12 app]$ mv sqoop-1.4.6.bin__hadoop-2.0.4-alpha/ sqoop
注意是装好zk和MySQL,hive,hadoop集群的
2,修改配置文件

  1. 进入到/opt/app/sqoop/conf目录,重命名配置文件
    [xian@hadoop12 conf]$ mv sqoop-env-template.sh sqoop-env.sh
  2. 修改配置文件
    [xian@hadoop12 conf]$ vim sqoop-env.sh
    增加如下内容
    export HADOOP_COMMON_HOME=/opt/app/hadoop-3.1.3
    export HADOOP_MAPRED_HOME=/opt/app/hadoop-3.1.3
    export HIVE_HOME=/opt/app/hive
    export ZOOKEEPER_HOME=/opt/app/zookeeper-3.5.7
    export ZOOCFGDIR=/opt/app/zookeeper-3.5.7/conf
    3 拷贝JDBC驱动
    1)将mysql-connector-java-5.1.48.jar 上传到/opt/soft路径
    2)进入到/opt/soft/路径,拷贝jdbc驱动到sqoop的lib目录下。
    [xian@hadoop12 software]$ cp mysql-connector-java-5.1.48.jar /opt/app/sqoop/lib/
    4 验证Sqoop
    我们可以通过某一个command来验证sqoop配置是否正确:
    [xian@hadoop12 sqoop]$ bin/sqoop help
    出现一些Warning警告(警告信息已省略),并伴随着帮助命令的输出:
    Available commands:
    codegen Generate code to interact with database records
    create-hive-table Import a table definition into Hive
    eval Evaluate a SQL statement and display the results
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值