【IT168 评论】传统关系型数据库在诞生之时并未考虑到如今如火如荼的移动、社交以及大数据负载类型,同时也并不适合处理极端规模处理任务。不过大家不必担心,十六家专业企业已经为我们带来他们各自的次世代NoSQL与NewSQL选项。
为什么在处理全新数据类型以及极端业务规模实例时,企业正越来越多地选择备用方案来替代占据领导地位的关系型数据库管理系统(简称RDMS)?
带着这个问题,我们与The Weather公司CIO Bryson Koehler进行了交流——这家公司目前正利用以Riak这款NoSQL数据库为基础的云天气预报系统,以系统每天20TB的惊人速度处理数据。他的回答非常坚决:
“我们知道自己需要在全球范围内运行,我们也知道自己需要处理天文数字级别的庞大数据总量。我知道自己需要从本质角度考虑如何建立这套系统方案。我不希望以附加方式实现、不希望它变成选项而非惟一答案,我更不希望被迫为其设立一个技术团队来专司维护工作。传统关系型数据处理方案繁琐而复杂,在我看来它也无法应对全球化规模的处理任务。”
在大规模云部署体系中,NoSQL的加入能够给我们带来强有力的支持。我们同样也听到过很多关于NoSQL灵活性、与架构无关的数据处理特性以及MongoDB与Couchbase等产品在部署简便性方面的优势。支持者们认为这些解决方案能够获取移动、社交、点击流以及传感器数据,而且在他们看来、为传统数据库添加JSON支持无异于为小猪描上口红。
面对这样的实际需求,很多支持者可能会力挺NoSQL产品——我们姑且不说SQL——已经是一种成熟的语言,支持着各种类型的事务型与分析型实例。而在NewSQL方面,目前已经有Clustrix、MemSQL以及VoltDB等厂商提供此类解决方案,承诺在保证NoSQL全球化扩展能力的同时又无需放弃SQL特性。
到目前为止,NewSQL选项在人气方面还远不及NoSQL类方案,这一部分是由于其面世时间相对较短、另一方面也是因为将传统方案与数据灵活性相结合绝非易事。进一步讲,NewSQL供应商们还需面对来自老牌SQL厂商的竞争压力,而客户们也更倾向于利用自己熟悉的老办法来解决业务中的新问题。不过NewSQL厂商们认为,这样的作法是个“代价高昂的错误”。
今天我们将一同近距离审视十六款值得关注的NoSQL与NewSQL数据库管理系统。今天我们暂时将图形数据库排除在外,这类方案主要用于非常特殊的网络分析环境,而且也不像NoSQL或者NewSQL那样属于适合广泛使用的方案。同样被排除在外的还有Redis以及Memcached等高人气产品,二者更接近数据缓存层而非持久性数据存储方案。
今天整理出的集合与之前的那篇《十六款优异大数据分析平台》也有所区别——虽然这些产品也能够满足操作型分析处理需求,但运行事务型应用才是其核心重点,而这也是数据库与分析平台之间的主要差异。我们也没有在标题中采用“优异”之类的字眼,因为这场比拼尚未尘埃落定,特别是NewSQL阵营的竞争更加有待观察。
闲言少叙,下面我们就一同看看这些面向现代数据管理需求的新型选项。
Aerospike内存支持实时决策
DBMS类型: NoSQL
描述: 闪存优化、分布式内存内数据库提供ACID合规性与可调整一致性
知名客户: Appnexus, BlueKai (现在由甲骨文持有), eBay
公司情况: 私营企业,于2009年建立,原名为Citrusleaf公司。
评论: Aerospike提供的内存内速度优势吸引到了众多要求实现毫秒级响应时间的广告网络以及其它Web规模企业的高度关注。Aerospike目前正积极进军新的业务类别,包括游戏、电子商务以及安全等对延迟状况要求较高的一切环境。我们也将密切关注这套平台,看看Aerospike是否能成为应用范围更广泛的解决方案。
官方网站:http://www.aerospike.com/
Cassandra在全球可扩展性竞争中一路领跑
DBMS类型: NoSQL
描述: 大规模可扩展分区行存储,配备多数据中心复制功能
知名客户: Constant Contact, eBay, Netflix
公司情况: Cassandra是由私营公司DataStax支持的开源项目,该公司成立于2010年
评论: Apache Cassandra的主要优势包括灵活性、NoSQL数据模型、多数据中心支持以及在集群化商用硬件上的线性可扩展特性。商业支持与软件发行版目前已经由DataStax正式提供。Cassandra一直享有最具可扩展性NoSQL数据库的良好声誉,不过它的高度复杂性也一直饱受诟病。财力雄厚的DataStax公司目前正在努力简化产品在企业用户层面的可管理性,同时为其加入了低延迟内存内功能;就在最近,Cassandra还根据需求与Apache Spark进行了集成。Couchbase与HBase都是Cassandra的主要竞争对手,其中后者运行在Hadoop环境下、也被广泛视为最关键的一大潜在威胁。
官方网站:http://www.datastax.com/