技术开发 频道

EnterpriseDB剑指Hadoop:优化数据处理

    【IT168 专稿】2011年11月8日,世界上领先的供应商EnterpriseDB正式发布了Hadoop的Postgres Plus(R) Connector。作为PostgreSQL衍生版本的EnterpriseDB却异军突起,近期频繁的市场动作无疑让人眼前一亮。

  开源数据库:EnterpriseDB异军突起

  EnterpriseDB是一家基于开源数据库PostgreSQL,提供增值服务的开源服务供应商。目前,MySQL、PostgreSQL、EnterpriseDB是全球三大开源数据库,而PostgreSQL是目前最为流行的开源数据库之一。与MySQL侧重在个人和轻量型数据库应用不同,PostgreSQL是一种面向企业级的数据库产品。EnterpriseDB所做的工作就是在PostgreSQL的基础上,集成各种组件和实用的工具,从而为PostgreSQL增加了一些高级特性,以满足各种高级需求。

  EnterpriseDB有三种产品,分别是基础版、标准版和企业版。其增值主要体现在后两个版本上。标准版中提供了客户端连接驱动、连接池、地理信息支持、自动软件更新; 企业版直接支持Oracle数据库的数据类型、SQL语法、PL/SQL、触发器、序列、自定义包等。针对Oracle设计的应用几乎不需修改即可在EnterpriseDB上快速运行,并且提供一键式迁移工具EnterpriseDB Migration Studio来简化数据库迁移过程,并生成完整的迁移报告,使之更适合高性能、高数据量、企业级功能数据库的核心应用。

  EnterpriseDB的产品另一个非常重要的特点是与Oracle数据库的兼容。事实上,保持与Oracle数据库的兼容性、让用户可以一键式地实现从Oracle数据库向EnterpriseDB的数据库迁移,已经成了 EnterpriseDB的一个非常重要的市场战略,而究其根源可能是想撬动Oracle帝国的根基,很显然,它把目标瞄准了Oracle数据库的潜在客户。

  EnterpriseDB发布Postgres Plus(R) Connector: 剑指Hadoop

  EnterpriseDB发布了基于Hadoop的Postgres Plus(R) Connector。该连接器允许访问Postgres Plus(R) Advanced Server (PPAS)以及PostgreSQL数据库中的大量数据,并支持在Hadoop集群上大量处理和分析数据。Hadoop的Postgres Plus(R) Connector允许程序员使用它们熟悉的MapReduce框架来处理基于SQL的批量数据。


  Hadoop是一个开源分布式的处理框架,集成了大量重要的应用程序,包括分布式文本搜索、web访问日志统计等等。Hadoop主要由三部分组成:HDFS(Hadoop Distributed File System),MapReduce与Hbase。

  

     1、HDFS是Hadoop分布式文件系统,它的主要设计目标是对成百上千的服务器集群导致的硬件错误检测和快速、自动的恢复能力,大数据文件的存储,数据的高吞吐量等。

  2、MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。MapReduce的设计目标是方便编程人员在不熟悉分布式并行编程的情况下,将自己的程序运行在分布式系统上。HBase是一个分布式的、面向列的开源数据库,由Apache基金会开发。

  3、HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。它基于列的而不是基于行的模式。

  企业为何选择基于Hadoop的Postgres Plus(R) Connector

  许多企业在它们传统的IT系统上部署了Hadoop应用,支持使用强大的新方法来整合数据集。因此,他们急切需要在Hadoop和SQL数据库之间建立一座数据桥梁,赋予Hadoop一种快速、稳健处理结构化数据和非结构化数据的能力。结合PPAS或者PostgreSQL,Hadoop允许用户执行实时查询Postgres数据库。使用Hadoop的Postgres Plus Connector,用户可以将SQL数据上传到Hadoop中,处理数据后,并将数据返回到Postgres中。

  “有了基于Hadoop的Postgres Plus Connector,Postgres Plus高级服务器用户就可以享受Hadoop带来的大规模处理、存储、分析数据的好处”,EnterpriseDB产品和市场部的副总裁Karen Tegan Padir表示。

  EnterpriseDB创建了Postgres Plus Connector,通过扩展Pig平台(这是一种在Hadoop平台上并行执行数据流的引擎),使用EnterpriseDB JDBC驱动,允许用户将SQL查询的结果导入Hadoop中,并将Hadoop中的数据备份到Postgres表单中。

  总结:Postgres Plus Connector将实至名归

  2011年11月1日,EnterpriseDB为客户和合作伙伴开放了一个适用于Hadoop测试版项目的私有Postgres Plus Connector。EnterpriseDB以及PostgreSQL公司提供了基于企业级的PostgreSQL产品和PostgreSQL服务,来帮助IT公司通过使用世界上较高级的开源数据库,从而走向成功。对于那些事务密集型的应用程序,需要优越的性能、可靠的扩展性、以及高度的数据库兼容性来减少数据库的整体成本。Postgres Plus Connector将实至名归,无疑是最好的解决方案。

Hadoop中国2011云计算大会专题:http://hadoop.it168.com/
Hadoop 中国2011 大会报名注册报名:http://hadoop.it168.com/index3.html

0
相关文章