数据库 频道

东方国信:CirroData行走在数据库百花齐放时代

  【IT168 专访】在DTCC2020大会上,有人说中国数据库卧薪尝胆20年终于迎来了一个好时代,这个时代百花齐放、百家争鸣,却也机遇与挑战并存。会上,IT168专访了东方国信CirroData数据库研发中心总经理金正皓,了解数据库技术的发展趋势,以及CirroData数据库的特性。

东方国信行云数据库CirroData研发中心总经理 金正皓

国产数据库发展的四个阶段

  近两年逐渐看到一些重大的核心业务系统迁移到国产数据库上,国产数据库正在不断突破自身,数据库作为基础软件三大件之一,更是受到前所未有的重视。在金正皓看来,国产数据库的自主可控之路大概经历了四个阶段。

  第一阶段是跟随阶段。2000年前后,主要跟随国外的Oracle、DB2等,国内当时主要是单机版数据库,都是国产数据库先驱,面临很大的困境,技术比国外的数据库技术晚十年以上,国外数据库成熟的产品、成熟的客户、成熟的使用案例都是国内跟随者所不具备的,集中在OLTP场景下,通过国家的扶持,商业环境比较艰难,是国产数据库技术的拓荒者。

  第二个阶段是2009年前后,针对数据仓库领域的MPP数据库技术蓬勃发展,国产MPP数据库领域与国外同类产品的技术差距逐渐缩小,同时国内客户对国产MPP的接受度逐渐提升。这个阶段MPP数据库主要应用在非核心业务场景,客户对系统可靠性、稳定性接受度较好。国产MPP数据库在数据仓库领域得到了较大的发展。

  第三阶段是2010-2020年技术大爆发阶段,在大数据、互联网、开源等技术的发展推动下,现有数据库技术无法满足国内企业应用场景的规模和性能等需求,国内技术人员对数据库内核相关技术掌握越来越深入和全面。一些云计算厂商以及部分数据库厂商,多是基于MySQL、PG等开源数据库做一些改造;CirroData也是从第三阶段起航。但CirroData并没有采用基于开源数据库进行改造的开发路线,而是由东方国信完全自主研发的国产分布式数据库。

  第四阶段,随着国家对自主可控的需求不断提高,国产数据库迎来更大的发展机遇。

  金正皓认为国产数据库从早期的跟随到替代国外产品,未来一定会在数据库行业出现局部的领先,最终走向全面的突破。就像2020年的疫情让所有人始料未及,未来也依然存在着不确定性。“不确定性也是机会,说明现在数据库市场处于野蛮生长的阶段,这个阶段是必须经历的,但我认为未来会殊途同归,未来会通过技术的聚焦,通过客户的聚焦,通过行业的聚焦,通过资本的聚焦,从百花齐放会逐渐聚焦到某些领域的某些厂家。”金正皓告诉IT168。

CirroData的分布式云化之路

  东方国信是国内较早做商务智能(BI)的综合大数据公司,从2002年开始做国内电信行业和金融行业的数据仓库建设,2011年上市,同期开始了CirroData的数据库自研之路。

  在东方国信为电信行业和金融行业构建数据仓库的过程中,随着业务量和复杂程度的不断提高,越来越感觉到集中式数据库和MPP数据库都不足以满足其需求,定位为分布式云化数据库的CirroData能有效解决这些问题。

  比如当时在电信领域,在早期企业数据仓库项目的架构中,设计了大量的多维立方体模型,用于支撑报表和多维分析,随着时间的进展,大量立方体很少被使用,但是这些立方体的仍然被定期加工,浪费了存储和计算资源,某企业粗略统计有60%到80%立方体被废弃。CirroData具备高性能统计分析的能力,可以基于明细数据快速生成相关分析数据,支撑全维度全指标的即席分析。很大程度上替代了原有的多维立方体,释放了存储和算力。

  2016年CirroData支持存储计算分离架构,为下一代云原生架构提供了底层技术支撑,并持续解决算力、存储的共享和隔离问题,2018年是CirroData的重要节点,当时基于电信运营商大规模数据集中的IT架构体系考虑,提出了逻辑集中、物理分散的大规模跨地域数据中心架构。

  整体来看,CirroData是一个产品家族,包含了OLAP和OLTP产品和HTAP产品,跨域多数据中心平台(Multi-data Center,MDC)产品,时序数据库、图数据库等,目前在OLAP场景比较成熟,已经在全国二十八省拥有数百客户,跨域多数据中心平台也有逐步推广应用。

  CirroData是一款分布式云数据库,金正皓对于分布式数据库和集中式数据库的关系有自己的判断。“我认为集中式永远有它存在的空间。”他指出集中式架构仍然适用于在高端用户的极端场景需求,在分布式架构成熟可靠之前,该场景或许在未来十年仍然存在,但这部分市场会逐步缩小。此外,集中式架构还存在一些长尾用户,它的数据规模、并发量、数据量都不大,类似于部门级应用或者小企业应用,依然有集中式架构的需求。他认为未来长尾用户可能会逐步迁移到分布式系统里,以免产生数据孤岛。

  回望刚刚过去的2020年,金正皓认为大数据在新冠疫情期间的防疫、防控让全国人民真正接触到大数据的应用,他对未来也充满信心,“中国毕竟是作为一个庞大体量的经济体,客户需求应该是根本。有中国这么大的数据量和丰富的应用场景,下一个十年内中国的数据库技术应该能够拥抱世界。”

4
相关文章