Hadoop生态系统全面盘点发展历程回顾-技术开发专区

Hadoop生态系统全面盘点发展历程回顾

作者：核子可乐译编辑：徐志远 2013-12-27 10:47 来源：51CTO

【IT168 评论】Hadoop拥有一个庞大而且充满活力的开发者社区，但Hadoop生态系统当中的很多项目在名称与功能的匹配性方面出入很大，这直接导致很多朋友难以分清各个项目的作用以及使用目的。

　　作为Hadoop的构建核心，HDFS与MapReduce是无法回避的两大要素。不过开发者及企业做出的大量贡献让Hadoop成为一套更为复杂的平台。生态系统中的一部分项目属于Apache基金会项目(在下图中以‘A’作为标注)，另一些则属于具备Apache许可、但却由企业负责运作(在下图中以‘AL’作为标注)的项目。

　　在今天的文章中，我们将对Hadoop的发展历程做一番回顾，看看如今其阵容之中包含着哪些“猛将”。

　　能做什么: 作为Hadoop的文件系统或者存储机制。

　　有何帮助: 创建一套重复性、可容错且可扩展的文件系统，旨在处理大型文件。利用数据位置提高MapReduce任务的数据输入性能。

　　能做什么: 一款高度可扩展的数据库。

　　有何帮助: 允许我们以线性方式对数据库进行扩展。提供可进行调节的数据一致性级别控制。

　　能做什么: 利用HDFS创建高度可扩展性数据库。

　　有何帮助: 实现高度可扩展特性与随机访问。利用HDFS保障严格的数据一致性。

　　能做什么:帮助分布式节点之间的数据实现同步。

　　有何帮助: 对集群中所有节点之间的一致性分布式小规模数据进行维护。

第1页：“猛将”一：Hadoop STORAGE&DATABASES 第2页：“猛将”二：Hadoop DATA&PROCESSING 第3页：“猛将”三：Hadoop DATA&INTEGRATION

关注我们