Hadoop是目前最成熟的大数据处理技术。Hadoop利用分而治之的思想为大数据提供了一整套解决方案,如分布式文件系统HDFS、分布式计算框架MapReduce、NoSQL数据库HBase、数据仓库工具Hive等。
Hadoop的两个核心解决了数据存储问题(HDFS分布式文件系统)和分布式计算问题(MapRe-duce)。
Hadoop的发展历史
Hadoop是由Apache的Lucence项目创始人道格·卡廷创建的,Lucence是一个应用广泛的文本搜索系统库。Hadoop起源于开源的网络搜索引擎Nutch,Nutch本身也是Lucence项目的一部分。Hadoop的发展历史如图所示。

Hadoop以其HDFS和MapReduce为核心,解决大数据存储与计算问题,源于Lucene和Nutch项目。详述了其发展历程。

741

被折叠的 条评论
为什么被折叠?



