【IT168 资讯】EMC公司于今天发布了自身的Apache Hadoop发行版——Pivotal HD,同时发布的还有一个名为HAWQ的技术,通过HAWQ能够将Greenplum(2010年被EMC收购的MPP数据库厂商)分析型数据库与Hadoop分布式架构进行紧密地融合。
根据知名科技媒体GigaOM的报道,Pivotal HD对Apache Hadoop进行了全面的“改造”,同其他一些Hadoop发行版(Cloudera、Intel等)相比,其最大的优势就是能够与Greenplum数据库进行整合,而不仅仅是在Hadoop中运行SQL这么简单。TechTarget数据库网站曾经报道过,EMC寄希望于通过Greenplum品牌(Greenplum Database & HD,Greenplum Chorus)打通大数据的“任督二脉”,而本次发布的Pivotal HD和HAWQ让EMC在Hadoop领域更进一步,同时将成为EMC大数据战略中的一个重要里程碑。
▲EMC发布Hadoop发行版:Pivotal HD(图片来自EMC)
据EMC相关负责人介绍,Pivotal HD可以简单地看做将Greenplum数据库的POSIX文件系统替换成Hadoop分布式文件系统(HDFS),而之前DBA在Greenplum数据库中所能做的所有操作,Pivotal HD都能够提供支持。同业界主流的Hadoop发行版相比,Pivotal HD能够处理更为广泛的大数据工作负载,并在性能方面得到显著的提升,还能够帮助用户节约一半的成本。
HAWQ完全是由EMC和Greenplum团队自主研发的技术,它能够在Hadoop分布式文件系统中提供最纯粹的并行SQL处理。HAWQ也是Pivotal HD中最核心的技术,它的一些特性包括:动态Pipelining,高级数据库查询优化器,纵向扩展功能,SQL兼容功能,交互式查询,深度分析功能以及普遍的Hadoop格式支持等。
据了解,MapR也将继续保持同EMC的合作伙伴关系,在其他Hadoop领域展开合作。而针对Greenplum的Pivotal HD,EMC将完全进行自主研发,有媒体称EMC此举是要挑战Cloudera在Hadoop领域的老大位置,后者不久前也发布了类似的产品Impala(参考链接:Cloudera Impala:将Hadoop变为分析型数据库 )。
原文链接:http://www.searchdatabase.com.cn/showcontent_70824.htm
更多精彩尽在2013年4月18~4月20日第四届中国数据库技术大会,北京永泰福朋喜来登酒店。
2月28日之前购票享7折优惠。