技术开发 频道

数据库选型之NewSQL渐热 选择需谨慎

  【IT168 评论】在如今的数据库市场,传统关系型数据库辉煌的日子已成过去时,NoSQL和新生阶段的NewSQL近年增长势头均是十分强劲。NewSQL是对所有新型可扩展、高性能数据库的简称,它们不仅有NoSQL对海量数据库的存储管理能力,还保持了传统数据库支持ACID和SQL等特性。这类新式的关系型数据库针对OLTP(读-写)工作负载,追求提供和NoSQL系统相同的扩展性能。

  由于传统数据库的基于磁盘的体系设计,很多方面无法突破,只能修修补补,难以有大的飞跃。NewSQL能够结合传统关系型数据库和NoSQL的优势,且容易横向扩展,这是数据库发展的必然方向。但目前市场上大多数NewSQL数据库都被作为叠加方案使用,以弥补已有数据库的不足,企业在选用时还需根据自身情况,考虑整体方案做出决策。对于技术资源并不丰富的企业,选用供应商提供的整合成熟方案也是一种不错的选择。接下来,本文列举较流行的几款NewSQL数据库并分析其现状,给用户作为参考。

  PostgreSQL正当时,跻身数据库排名前五

数据库选型之NewSQL渐热 整合方案居多

  近日DB-engines发布了2015年8月数据库排行榜,PostgreSQL是唯一挤进前十的NewSQL数据库。PostgreSQL的市场占有率虽然远不如名列前三的传统关系型数据库,但从其流行变化曲线看,增长幅度几乎达到正比。

数据库选型之NewSQL渐热 整合方案居多
▲PostgreSQL近年流行度变化曲线

  目前,PostgreSQL是除MySQL外最受欢迎的开源数据库,稳定性很强,在高并发读写负载逼近极限下,其性能指标仍可以维持双曲线甚至对数曲线。PostgreSQL有大量的几何、字典、数组等数据类型,一直在GIS领域处于优势地位。

  很多人都喜欢拿PostgreSQL与MySQL对比,MySQL整体呈下降趋势,地位不复当年,越来越多的人开始关注PostgreSQL。然而以市场占有率来看,PostgreSQL还是远不如MySQL。其实并不是二者功能相差有多大,相反,PostgreSQL有很多强大的功能,代码也十分优雅干净。当年MySQL借势互联网被广泛应用,其应用相对简单且量级轻,一度十分流行,在被Oracle收购之后商业配套支持愈加完善。这是习惯造成的结果,失了先机的PostgreSQL学院气息浓重,开源社区和技术的支持有限,成熟方案较少。加上背后缺少商业配套解决方案支持,导致其应用的技术门槛高,很多公司望而止步,这一现象在国内尤其明显。

  但近年PostgreSQL仿佛迎来了春天,随着大数据和移动互联网的发展,产业竞争激烈,PostgreSQL与市场需求的契合度提升,其强大的功能和代码的优势渐渐受人瞩目。PostgreSQL自身也在发展进步,国内多家企业都开始应用PostgreSQL。腾讯在2011年开始于内部应用和推广PostgreSQL技术,弥补其数据仓库TDW的劣势,如对小数据处理性能低,update/delete性能差、接口不丰富等问题。阿里云在2015年6月正式宣布推出RDS for PostgreSQL服务,来提升对SQL标准和NoSQL的兼容和处理复杂查询的能力,节省了运维成本和硬件投入。除此之外,去哪儿网、好视通和华为等企业也开始了对PostgreSQL的应用。

  特性:复杂查询、外键、触发器、试图、事务完整性、MVCC(多版本并发控制)

  开发语言:C/C++

  是否开源:开源

  许可:BSD

  支持语言:C、C++、Python、Java、PHP、Ruby等

  SAP HANA,热度提升迅速

数据库选型之NewSQL渐热 整合方案居多

  SAP HANA是SAP公司于2011年推出的基于内存计算技术,面向企业分析性应用的产品。HANA产品主要包括内存计算引擎和HANA建模工具两部分。提供数据插入、修改和高效的查询功能,用户可以直接对大量实时业务数据进行查询和分析,而不需要对业务数据进行建模、聚合等。其实,HANA不是一个数据仓库,而是平台,它允许用户在其上构建数据仓库或集市、报表和仪表盘等。通过SAP HANA可直接访问运营数据,而不影响SAP ERP和其他运营系统的性能。

数据库选型之NewSQL渐热 整合方案居多
▲SAP HANA近年流行度变化曲线

  SAP HANA能够高速处理数据,且有商业配套产品SAP ERP相助,这是它的最大优势,而列式存储是HANA的杀手锏。近年SAP HANA增强了推广力度,SAP的用户也通常是Oracle的最大客户,SAP对其新型数据库的推广措施吸引到了少部分用户。看到了SAP HANA在未来服务器市场增长的潜在机会,IBM于14年底在POWER系统上成功安装SAP HANA,几个月前,IBM又宣布了一系列POWER8服务器针对SAP HANA内存计算应用优化方案,以求用类似x86服务器在SAP HANA应用上的方案来提供更具性价比硬件产品。

  SAP HANA很大一部分用户都是从ERP而来,有此需求的用户将HANA作为解决方案的完善。近日,为解决中国石油ERP系统遇到的性能难题,中油瑞飞将中国石油ERP系统逐步向SAP HANA平台进行迁移。

  特性:SAP HANA用大内存提供内存数据库,列式存储高效数据压缩;将大部分数据库操作push到硬件,通过高性能硬件提高数据查询速度,减少需要在存储和内存间移动的数据量,通过高速网络接口提供数据传输的效率。

  开发语言:sqlscript/R

  是否开源:否

  许可:商业软件

数据库选型之NewSQL渐热 整合方案居多
▲DB-engines数据库排行榜(2015年8月)

  以上列举的两个数据库,是目前较主流的NewSQL数据库。以下列举一些其他NewSQL数据库。

  VoltDB,打理高速流数据(数据库排行第76)

数据库选型之NewSQL渐热 整合方案居多

  VoltDB是关系型且基于内存的数据库,其采用的高分布式内存内架构,拥有大规模高速事务处理能力。最新版本VoltDB 4.0对分析处理能力进行了升级,查询数据执行能力更强,支持并发用户操作以及更深层次的SQL时间序列分析能力。VoltDB有社区版和企业付费版,企业付费版有额外的增强功能,包括计算机集群管理控制台、系统性能仪表盘、数据库宕机恢复、在线数据库Schema修改、在线数据库节点重新加入、JDBC和OLAP导出支持、命令日志等。VoltDB用户有惠普、爱立信以及三菱等企业,业务大多涉及fast data和高并发的应用等。

  MemSQL,号称世界上最快的内存(数据库排行第89)

数据库选型之NewSQL渐热 整合方案居多

  MemSQL有符合ACID原则的事务处理性能、SQL兼容性以及高度优化的SQL存储引擎。这些系统提供了与MySQL相同的编程接口。MemSQL兼容MySQL但快30倍,能实现每秒150万次事务。MemSQL在去年获得了3500万美元的融资,其最新版本为近年5月发布的4.0.27(包含了完全免费的社区版和商业版),版本核心引擎创新,快速响应,提升了在物联网、金融服务、以及移动应用等领域的业务表现。

  NuoDB,SQL与云集于一身(数据库排行第105)

数据库选型之NewSQL渐热 整合方案居多

  NuoDB是运行在云和系统上的软件,它包括管理层、事务层和存储层。NuoDB的一大发展转折在于通过内置的多租户支持能力着重强调云部署方案。NuoDB的云数据库管理系统支持SQL查询,多版本并发控制,ACID事务(原子性、一致性、隔离性、持久性),更可方便地扩展至多个节点。

  Clustrix,云计算时代的MySQL(数据库排行第129)

数据库选型之NewSQL渐热 整合方案居多

  Clustrix于2010年发布初始版本,它支持最简单的Key-Value格式,还兼容MySQL的功能,在业内被称之为云计算时代的MySQL。Clustrix一直以高度分布式特性、可扩展容错性且无需牺牲SQL或者ACID事务处理性能为主要卖点。它提供了和SQL数据库相似的功能,同时还可以对数据存储进行扩展,其用户有iOffer和Photobox等企业。

    eXtremeDB,实现极速实时数据管理(数据库排行第177)

数据库选型之NewSQL渐热 选择需谨慎

    eXtremeDB的内存嵌入式实时数据库是美国麦科捷所开发,它以高性能、低开销、响应速度高、稳定可靠等特性,在嵌入式数据管理领域及服务器实时数据管理领域独领风骚。此系统尤其适合新兴网络和连接设备。eXtremeDB跨多硬件和软件平台部署,在内存处理架构优化上很有优势。在国内,eXtremeDB在网络设备、消费电子、军工、航空航天、工业控制、汽车电子,以及金融实时交易、银行等领域都有所应用。

0
相关文章