广义上来说,Hadoop大数据平台也可以看做是新一代的数据仓库系统, 它也具有很多现代数据仓库的特征,也被企业所广泛使用。因为MPP架构的可扩展性,基于MPP的数据仓库系统有时候也被划分到大数据平台类产品。
但是数据仓库和Hadoop平台还是有很多显著的不同。针对不同的使用场景其发挥的作用和给用户带来的体验也不经相同。用户可以根据下表简单判断什么场景更适合用什么样的产品。
|
特性 |
Hadoop |
Data Warehouse |
|
计算节点数 |
可到数千个 |
一般在128个以内 |
|
数据量 |
支持大于10PB |
一般不大于5PB |
|
数据类型 |
关系型,半关系型,无结构化,语音,图像,视频 |
关系型 |
|
时延 |
中/高 |
低 |
|
应用生态 |
创新型/人工智能 |
传统数据库型/BI类 |
|
应用开发接口 |
SQL,MR,丰富的编程语言接口 |
标准数据库SQL |
|
可扩展性 |
无穷的可能,完整的编程接口 |
有限扩展能力,主要通过UDF支持 |
|
事务支持 |
有限 |
完整 |
数据仓库和Hadoop平台互为补充,立足于满足客户在不同使用场景下的业务需求。公有云数据仓库服务DWS能够无缝地接入到公有云Hadoop平台MRS服务上,支持SQL-over-Hadoop的这个特性,提供跨平台, 跨服务的数据共享。让用户在充分享受Hadoop带来的开放,便捷,创新的同时,继续使用熟悉的数据(仓)库方式管理和使用自己的海量数据。继续使用传统的数据仓库的上层应用,特别是商业智能BI类的应用。
在这里我还是要推荐下我自己建的大数据学习交流qq裙:522189307 , 裙 里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴。上述资料加群可以领取

数据仓库和Hadoop大数据平台虽然有相似之处,但存在显著区别。Hadoop具备现代数据仓库特征,但两者在使用场景和用户体验上有所不同。数据仓库适用于传统BI应用,而Hadoop则强调开放性和创新。公有云数据仓库服务如DWS能与Hadoop平台如MRS无缝对接,支持SQL-over-Hadoop,提供跨平台数据共享。

2591

被折叠的 条评论
为什么被折叠?



