1.从oracle到hdfs
sqoop import --connect jdbc:oracle:thin:@ip:port:orcl --username user1 --password ******--query 'select parti_id,parti_typ_cd from t00_parti where 1=1 and $CONDITIONS' --split-by parti_id -m 1 --target-dir /user/xb6
2.从hdfs到hive
CREATE EXTERNAL TABLE ds.t00_parti (
parti_id VARCHAR(50) ,
parti_typ_cd VARCHAR(50)
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/user/xb6/';
3.从hdfs到oracle
sqoop export --direct --connect jdbc:oracle:thin:@ip:port:dev --username test01 --password ******--table T00_PARTI --export-dir /user/xb6/part-m-00000
本文介绍了一种从Oracle数据库导出数据至HDFS,再将数据加载至Hive表,最后重新导入至Oracle数据库的方法。使用了Sqoop进行数据的导入导出,并通过创建外部表的方式在Hive中读取HDFS上的数据。

2194

被折叠的 条评论
为什么被折叠?



