Hive建表以及表字段分隔符
Tips:
1.最后一个字段不需要加逗号;
2.external 是外部表的标志,不加关键字则是内部表,外部表删不掉数据。一般做测试表的话建议建内部表,删除方便;
3.分区字段 partition by('XXXX' TYPE,'OOOO' TYPE...)不能出现在创建表时的字段中,换句话说,分区字段字段也是新的字段,在别的表中用的时候和普通字段使用方法是一样的;
建表语句示例:
CREATE external TABLE `table1`(
`name` string COMMENT '姓名',
`id` int COMMENT 'ID'
)
PARTITIONED BY (
`province_id` int,
`day` int)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
'field.delim'=',',
'serialization.format'=',')
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat';
-- 以字段间以“,”为分隔符,行间以tab为分隔符
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
'field.delim'='|',
'serialization.format'='|')
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat';
-- 以字段间以“|”为分隔符,行间以tab为分隔符
在本地导入hive数据时需要制定分隔符,注意区分;
其他格式分隔符查询官网。
本文介绍了如何在Hive中创建表格,并详细解释了表格字段分隔符的设置方法。此外,还提供了创建外部表和内部表的区别说明及分区字段的使用技巧。

8446

被折叠的 条评论
为什么被折叠?



