将 csv文件导入到hbase中
利用ImportTsv将CSV文件导入
首先将文件上传到hdfs上
hadoop fs -put /hbasePut.csv /Hbtest

在 hbase 中创建一张表,这张表即为 CSV 文件数据导入的表

然后退出 hbase shell ,输入下面命令调用 ImportTsv 将 csv 数据导入表中
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator="," -Dimporttsv.columns=HBASE_ROW_KEY,info:sno,info:sname,info:plt,info:alb,info:age40_60,info:ca,info:age_40,info:smo_his,info:le_woed,info:cap,info:age61_74,info:age74_,info:score hbase-csv1 /Hbtest/hbasePut.csv
一些解释
格式:hbase [类] [分隔符] [行键,列族] [表] [导入文件]
-Dimporttsv.columns=HBASE_ROW_KEY为行键
info为列族
后面则为列名
用hbase shell查询表的内容
scan 'hbase-csv1'
数据量较大,仅展示中间过程

统计表中数据行数
count 'hbase-csv1'

用phoenix在hbase上完成关系型数据库查询语句对表的查询
select * from "hbase-csv1"
结果较大,仅展示后面几行

本文介绍了如何将CSV文件上传到HDFS并导入HBase,包括创建表、使用ImportTsv命令、查询数据行数及Phoenix查询。重点展示了导入过程和关键步骤。

1988

被折叠的 条评论
为什么被折叠?



