技术开发 频道

专访赵伟:南大通用打造云+NewSQL新模式

  【IT168 专稿】在云计算时代,传统关系型数据库暴露出很多不足。这类数据库不易扩展、缺乏并行性、很难部署在有大量节点的SN集群上,对海量数据处理不利限制了其发展。基于云时代的需求市场,大量公有云数据库和私有云数据库往往是以NoSQL为基础的,例如基于Hadoop架构的HBase、Google的Bigtable等。NoSQL本身的非线性、分布式、水平可扩展等特点,非常适合云计算海量数据运算。

  然而,Hadoop在面对传统关系型数据复杂的多表关联分析、强一致性要求、易用性等方面,与分布式关系型数据库还存在较大的差距,NoSQL目前提供的应用也趋于简单化。于是出现了一种基于云架构的新型数据库——NewSQL,在传统数据库基础上支持SN集群,提高了系统伸缩性。例如EMC的Greenplum、南大通用的GBase 8a MPP Cluster、HP的Vertica都属于此类产品。近日,IT168记者采访了南大通用数据技术有限公司副总裁赵伟先生,分享了南大通用在应对行业大数据的过程中所做的创新和实践。

专访赵伟:南大通用打造云+NewSQL新模式
▲南大通用数据技术有限公司副总裁赵伟先生

  NewSQL是数据库的未来

  在大数据的需求推动下,数据库行业展开新一轮的创新。以Oracle为代表的行业垄断受到了强烈挑战,全世界至少有30家新兴的数据库企业和大约50款新产品进入市场竞争。南大通用作为国产数据库的领军企业,针对大数据的市场环境推出创新理念和产品——NewSQL和GBase 8a。

  数据处理架构的变革理论源于Stonebraker教授的论文。其在论文中认为行业的技术大思路应该由“一种架构支持所有应用”转变成“多种架构支持多类应用”。在云计算海量大数据的市场趋动下,已经验证了这点。南大通用将其理论做了进一步延伸和细化,将目前数据库行业分为三大阵营即:OldSQL、NewSQL和NoSQL。其中OldSQL,即传统的数据库厂商: 例如Oracle的 Exadata等;NoSQL,基于Hadoop架构的HBase、Google的Bigtable、Cassandra等;NewSQL,EMC Greenplum、南大通用的GBase 8a、HP Vertica属于这个产品的代表。

NewSQL是数据库的未来
▲数据库行业的三大阵营

  赵伟表示,数据库行业的未来是NewSQL,并将成为主流的数据库产品类别,具有极高的商业价值。在三大产品阵容中,NewSQL在保持了关系模型的基础上,对存储结构、计算架构和内存使用等数据库技术的核心要素进行了有深度的改变和创新。NewSQL和NoSQL将打破OldSQL服务于所有应用而一统天下的局面,与OldSQL三分天下形成三类产品各自拥有最适用的应用类型和客户群的局面。同时NoSQL和NewSQL都表现出了面对海量数据时较强的扩展能力。NoSQL另外一方面优势在于对非结构化数据的处理支持上,而NewSQL作为新一代数据库产品,产品对于全数据格式的支持也已经日趋成熟。

  NewSQL相比NoSQL,在实时性、复杂分析、即席查询和开发性等方面表现出独特的优势。具体来说,NewSQL整体优化较好,实时性较强,而NoSQL相比实时性较差;NewSQL采用多种索引和分区技术保证多表关联,效率较高,而NoSQL缺少高效索引和查询优化,复杂分析差;NewSQL采用列存储和智能索引保证了即席查询性能,而NoSQL只能做精确查询不能做关联查询;NewSQL是基于标准的成熟商业软件,对用户的研发能力要求相对较低,而NoSQL属于平台型的模块、没有标准,对用户的研发能力要求较高。

2
相关文章