1、HDFS是Hadoop分布式文件系统,它的主要设计目标是对成百上千的服务器集群导致的硬件错误检测和快速、自动的恢复能力,大数据文件的存储,数据的高吞吐量等。
2、MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce的设计目标是方便编程人员在不熟悉分布式并行编程的情况下,将自己的程序运行在分布式系统上。HBase是一个分布式的、面向列的开源数据库,由Apache基金会开发。
3、HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。它基于列的而不是基于行的模式。
企业为何选择基于Hadoop的Postgres Plus(R) Connector
许多企业在它们传统的IT系统上部署了Hadoop应用,支持使用强大的新方法来整合数据集。因此,他们急切需要在Hadoop和SQL数据库之间建立一座数据桥梁,赋予Hadoop一种快速、稳健处理结构化数据和非结构化数据的能力。结合PPAS或者PostgreSQL,Hadoop允许用户执行实时查询Postgres数据库。使用Hadoop的Postgres Plus Connector,用户可以将SQL数据上传到Hadoop中,处理数据后,并将数据返回到Postgres中。
“有了基于Hadoop的Postgres Plus Connector,Postgres Plus高级服务器用户就可以享受Hadoop带来的大规模处理、存储、分析数据的好处”,EnterpriseDB产品和市场部的副总裁Karen Tegan Padir表示。
EnterpriseDB创建了Postgres Plus Connector,通过扩展Pig平台(这是一种在Hadoop平台上并行执行数据流的引擎),使用EnterpriseDB JDBC驱动,允许用户将SQL查询的结果导入Hadoop中,并将Hadoop中的数据备份到Postgres表单中。
总结:Postgres Plus Connector将实至名归
2011年11月1日,EnterpriseDB为客户和合作伙伴开放了一个适用于Hadoop测试版项目的私有Postgres Plus Connector。EnterpriseDB以及PostgreSQL公司提供了基于企业级的PostgreSQL产品和PostgreSQL服务,来帮助IT公司通过使用世界上较高级的开源数据库,从而走向成功。对于那些事务密集型的应用程序,需要优越的性能、可靠的扩展性、以及高度的数据库兼容性来减少数据库的整体成本。Postgres Plus Connector将实至名归,无疑是最好的解决方案。
Hadoop中国2011云计算大会专题:http://hadoop.it168.com/
Hadoop 中国2011 大会报名注册报名:http://hadoop.it168.com/index3.html