hive的特性
Hive不是一个完整的数据库。
Hadoop和hdfs的局限性通常也掣肘着hive。
Hive 不提供记录级别的update, insert, delete,需要join的方式来变相达到。
由于hadoop是面向批处理的系统,所以hive查询存在高延迟。
hive是对熟悉sql的开发者来说是友好型的。

所有的命令和查询都将流向Driver,Driver的作用是编译输入值,优化计算,执行必要的步骤,类似MapReduce任务。
当产生MapReduce任务,hive不产生类似于java的mapReduce代码,相反的,它使用由内嵌的原生的由xml文件驱动的Mapper和Reducer模块,换句话说,这些模块函数就是将计算任务编码成xml格式的“翻译官”。
hive cli命令行
$ hive --help --service cli usage: hive
-d,--define <key=value>
-e <quoted-query-string> -f <filename>
-H,--help
-h <hostname>
--hiveconf <property=value> --hivevar <key=value>
-i <filename> -p <port> -S,--silent -v,--verbose
Variable substitution to apply to hive commands. e.g. -d A=B or --defin

本文介绍了Hive的基本特性和限制,强调了其面向批处理、不支持记录级更新的特点。同时,详细讲解了Hive的命令行接口(CLI),包括数据类型、类型转换以及非交互模式下的常用命令,如-e、-f、-i等选项的用法。此外,还提到了在交互模式下的一些关键命令,如quit、reset、set等,并涵盖了添加、列出和删除DistributeCache资源的操作,以及创建自定义函数的方法。
&spm=1001.2101.3001.5002&articleId=88262101&d=1&t=3&u=c7662eb2b00e438cb2cd0a4180af7167)
804

被折叠的 条评论
为什么被折叠?



