2020年12月21日~12月23日,由IT168旗下ITPUB企业社区平台主办的第十一届中国数据库技术大会(DTCC2020),在北京隆重召开。在会上,武汉达梦数据库股份有限公司副总经理冯源分享了达梦公司的分布式数据库演进、发展历程,并介绍了达梦公司对分布式数据库未来发展和应用前景的分析观点。冯源表示,企业级市场是个蓝海,国产数据库正迎来一个“超车”的机会,但现在布局分布式数据库厂商很多,技术路线也很多,用户要综合决策,避免走弯路。
武汉达梦数据库股份有限公司副总经理冯源
“需求第一性”推动数据库产业升级
参加2020年的中国数据库技术大会(DTCC2020),冯源明显感觉到议题越来越广泛,数据库产业越来越百花齐放。讨论的问题层次也越来越深入。比如,以前讨论如何应用,现在讨论怎么设计、怎么规划。同时,围绕数据库这一核心,包括AI等技术正不断加入进来。议题变化的背后,是中国数据库产业的转型升级,越来越走向高端。
从上世纪七八十年代发展至今,分布式数据库产业走过了三次大的浪潮:
上世纪七八十年代,国际学术界就已启动了对分布式数据库的研究。当时学术界对于分布式数据库的研究主要分为两个架构:一个是分层的集中式控制,在很多区域性的数据库上面加了一个分布式的调度层。另一个是非集中式数据库,更加接近现在的数据库,就是去中心化的架构。也就是在这个时候,分布式数据库抽象出三大特点,一是在地理上实现跨区域、跨物理地域的特点;二是局部的自制性,任何数据库都应该具备本地管理、本地处理的能力;三是应用透明性。综合起来,分布式数据库需要具备的点就是在物理上分布、在逻辑上异同。
九十年代分布式数据库进入沉寂期,与之相反的是集中式数据库开始爆发。八九十年代是硬件发展的黄金周期,硬件的集中速度非常快,使得集中式数据库具备了处理内部并发数据的能力,局域网的技术全部都已经能够支撑起来。同时,交易中间件诞生,改变了应用程序访问数据库的访问模式,从两层结构变成三层结构,使得集中式数据库足以应对当时的并发数据请求能力。人们失去了进一步使用分布式数据库的理由。
达梦数据库在1989年发布的第二代数据库产品DM2就是分布式数据库管理系统,在那个时候做分布式数据库的研究,整个体系结构、存储结构和随机查询方面都做了一些工作,但因为市场的变化,最后变成了集中式数据库产品。
如今,随着移动互联网的兴起,分布式数据库再度兴起。随着互联网、移动通信、物联网等新技术趋势的发展,传统关系数据库的技术架构和服务水平,逐渐无法满足新业态的发展需求。2019年,达梦数据库认为分布式数据库最大的问题是兼容性太高,所以提倡透明式TDD的概念,具有比较强的一致性,同时具备一些可扩展的能力。到了2020年,达梦数据库发布了新一代的原生数据库,希望在透明式分布式数据库的基础上进一步加强分布式处理能力。
回到发展阶段的初衷来看,“需求第一性”是分布数据库发展的推动力,也就是站在用户的角度要不要用分布式数据库,如何发展分布式数据库。
“超车”好时机,推动国产数据库进入第四阶段
在冯源看来,国产数据库产业经过了三个阶段的发展:
第一个阶段,是早期学习、研究阶段,局限在学术圈子。
第二个阶段在尝试做市场化的工作,但因为台阶低起步低,更多的是去模仿、跟随、尝试,在这个过程中得到用户的反馈,无法跟产品形成正向的反馈循环产生利润再推动发展,这个阶段市场和产品意识开始觉醒。
第三个阶段产生一定市场规模,数据库厂商根据用户需求去研究产品,采用完全市场化的运作方式,并产生正向反馈。
现在国内数据库厂商基本在第三阶段,并逐渐向第四阶段过渡。中国有非常大的市场体量,一定会催发出来非常多的用户需求。推动数据库厂商实现用户多样化的需求,并有可能会被其他国家认可,国产数据库产品也会出海,这就变成第四阶段。
对于国产数据库厂商来说,这是难得的超车机会,在这个方向上也已经有了一定的程度的优势。但目前国内分布式数据库有很多的技术流派,市场状态很繁杂,乱花渐入迷人眼,并且出现了容易给产品和厂商贴标签的情况。但是用户要把决策做好,选出符合自己需求的技术路线,最的忌讳是帖标签,不能只远远的看一眼标签,还是应该做理性的分析,例如:要清楚自己想要什么,需要的是同等性能下更低成本,更方便,不需要很多运维人员,成熟的拿过来直接用的技术。
自主研发与创新,倡导成熟透明的分布式数据库
在新的挑战和机遇下,达梦公司对分布式技术进行了大量探索。推出了得到广泛应用的关系数据库产品,在电力、金融、政务、公安、社保、交通等行业领域得到了广泛应用。
达梦分布式数据库有两个主要的优势:
第一:1000公里及以上跨大区域范围地理跨度的部署,传统数据库基本上几十公里做个灾备,如果要上1000公里一定会丢数据。而分布式数据库可以保证在性能下降可接受的程度范围内不丢数据。达梦分布式数据库可以跨省、甚至跨国、洲际部署,而且不丢数据,切换时间在几十秒范围内。
第二,计算能力扩展能力和存储层扩展能力。可以把集群、系统达到几百个甚至上千个节点,性能天花板到了以后无法再加配置的问题改成经济问题。
二十年来,达梦数据库经受住了开源产品的冲击、免费代码的诱惑,始终不忘初心,坚持“自主研发与创新”,致力于数据库核心技术的突破,根据权威检测,达梦产品代码自主原创率达99.9%,是200多家数据库厂商中唯一一家坚持自主设计、自主编码的数据库。
对业界主流架构进行了深入分析和研究之后,达梦提出了透明分布式数据库技术,并推出了达梦透明分布式数据库「DMTDD」,既具有分布式数据库的高可扩展、高可用、高并发处理能力,且对用户透明,同时又具备传统数据库的所有高级特性,支持传统数据库所有开发接口和业务开发框架的技术架构,对用户透明的创新架构。这些特性决定了在业务品种和业务量爆炸式增长的过程中,达梦产品将成为重要行业核心业务架构的选择,满足金融、电信、互联网等关键行业的用户需求。
在冯源看来,如果给分布式数据库打一个分,100分表示非常成熟,那分布式数据库现在可能50分到60分。这也是为什么达梦倡导成熟、透明式的原因。从产业上来说,分布式数据库仍未成熟,没有做好大面积的接管传统业务的准备,说从50分、60分到100分最大的挑战就是不够透明、不够通用。但企业级市场是个广阔的蓝海,数据库厂商应该让用户聚焦业务,才是服务好用户,真正把国产数据库生态做好、做强。