学习前的思考
1.Hive的数据存储在什么地方?
2.Hive的数据格式什么?
3.Hive用户定义数据格式需要什么标准?
4.Hive为什么数据加载比传统数据块快?
5.Hive的数据是否经常被修改?
6.Hive在什么情况下,比传统数据块延迟高?延迟高的原因是什么?
------------------------------------------------------------------------------------------------------------------------------------------
由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive和数据库除了拥有类似的查询语言,再无类似之处。本文将从多个方面来阐述Hive和数据库的差异。数据库可以用在Online的应用中,但是Hive是为数据仓库而设计的,清楚这一点,有助于从应用角度理解Hive的特性。
| 查询语言 |
HQL |

本文探讨了Hive与传统数据库的差异,包括Hive的数据存储在HDFS中,数据格式用户可定义,数据加载速度快但不支持频繁修改,且没有索引导致延迟较高。Hive适用于大规模数据仓库,依赖MapReduce执行查询,而数据库则更适合在线数据查询,具有较低延迟和良好扩展性,但数据规模受限。

650

被折叠的 条评论
为什么被折叠?



