【IT168 资讯】微软近日宣布正在开发适用于Windows Server与Windows Azure平台的开源Hadoop框架。而一向对开源趋势不屑一顾的微软为何大张旗鼓,加入开源阵营,声称支持Hadoop呢?那么Hadoop有什么特别的优点呢?本文将为您揭晓答案。
Hadoop体系架构
Hadoop是一个分布式系统基础架构,由Apache基金会开发。Hadoop的主要目标是对分布式环境下的“大数据”以一种可靠、高效、可伸缩的方式处理。设想一个场景,假如您需要grep一个100TB的大数据文件,按照传统的方式,会花费很长时间,而这正是Hadoop所需要考虑的效率问题。
Hadoop主要由三部分组成:HDFS(Hadoop Distributed File System),MapReduce与Hbase。
HDFS是Hadoop分布式文件系统,它的主要设计目标是对成百上千的服务器集群导致的硬件错误检测和快速、自动的恢复能力,大数据文件的存储,数据的高吞吐量等。