数据库 频道

金山云数据库之路

  DragonBase是金山云研发的新一代分布式云原生数据库,这是金山云新闻稿中的描述。

  金山云于2016年在公有云上发布了DragonBase单机版,并在2020年发布了DragonBase分布式2.0版本。在2020年以前,金山云几乎没有对外宣传过DragonBase数据库产品,业内知道的人较少,这点通过搜索引擎搜“DragonBase”就能一目了然。

  2020年以来,金山云在数据库领域变得活跃,在加大其核心分布式数据库产品DragonBase宣传力度的同时,布局数据库细分领域生态合作,例如为优化数据库产品体验,与海量数据达成战略合作,投资偶数数据库等。

  那么,金山云分布式数据库DragonBase具体是什么样的数据库?在数据库领域默默耕耘五年的金山云,为何在2020年变得活跃起来?金山云针对数据库的发展有怎样的思考,在产品上又有什么新的布局?

  近日,在DTCC2020大会上,老鱼采访了金山云数据库资深架构师张健。

  上云已经是大势所趋。Gartner指出,云将主导数据库市场的未来,到2022年将有75%的数据库迁移或部署在云平台。

  对公有云厂商来说,作为三大系统软件之一的数据库,其重要性不言而喻。张健说,金山云作为独立的云服务商,技术立业为本,构建完备的云计算基础架构和运营体系,结合先进技术(如AI、大数据、物联网、区块链、边缘计算等等)提供各行业服务解决方案。数据库作为公有云的核心基础产品之一,不仅起到承上启下联动SaaS和IaaS服务的作用,也能横向贯通PaaS服务体系,应用极其广泛,数据管理价值极其重要,数据库技术投入是长期的技术价值储备和业务价值布局。

  金山云认为数据库是云厂商必备的核心技术能力。

  2016年,金山云开始布局数据库,并发布DragonBase单机版,2017-2018年,深度优化单机版本稳定性和性能,发布数据库迁移工具DTS,2019年发布DragonBase分布式1.0版本,支持分布式事务、分布式计算、完善备份恢复体系,2020年发布升级版本2.0,优化分布式事务,扩展分布式计算,优化高可用方案,提供弹性扩容、数据强一致、安全审计、云管平台和数据迁移等诸多核心能力,正在研发的DragonBase3.0版本将在Oracle兼容、分布式计算引擎和自动化运维等方面进行迭代。

  DragonBase,这个名字其实想了很久,张健说。飞龙在天,龙腾云霄,龙寓意吉祥和力量,而金山云是正好是家云计算公司,恰到好处,因此我们给数据库命名为DragonBase,也包含了我们的产品愿景。

  事实上,金山云正在全面布局数据库产品矩阵,在基础资源兼容方面,支持物理机、虚机和容器化部署,支持X86平台和主流ARM平台,存储类型支持本地磁盘、云盘和分布式存储系统;在数据库类型方面,包括关系型数据库MySQL、PostgreSQL和SQL Server等,键值数据库Redis、Memcache和Cassandra,文档型数据库MongoDB,时序数据库InfluxDB;在数据库管理平台建设方面,包括接入服务、管控服务和数据服务。

  谈到DragonBase的竞争优势,张健表示,在分布式数据库云化能力建设方面,既可对标互联网大厂,也可对标新型数据库公司和传统数据库公司,金山云具备原生的云化部署能力,既支持自有平台部署,也支持基于第三方平台部署。

  对于强依赖公有云基础设施的数据库产品,独立私有化部署涉及关联服务剥离,开发和维护成本很大。金山云DragonBase实现公有云和私有云工程同源,双线并行,减少外部依赖,降低运维成本,灵活对接公有云部署和私有云部署。

  相比互联网大厂的云原生分布式数据库,金山云DragonBase有自己独特的竞争优势,凭借其原生的云化部署能力同时支持自有平台和第三方平台,基于同源工程低成本支持公有云和私有云部署,配合云基础设施优化性能实现高性价比,在多个应用场景下落地并取得不错的成绩。

  相对于传统数据库公司,金山云作为一家云计算公司,其完善的云基础设施,可提供包含数据库在内的行业解决方案和服务能力,具备其先天的竞争优势。

  对于新型的NewSQL数据库,把关系型和非关系型数据库的特性相结合,在兼具两者优势的同时,也放弃了两者的部分特性,有得有失。

  张健强调,目前DragonBase已在金融、互联网、公共服务、游戏等多领域实践应用。

  专访最后,对于分布式数据库选型,张健还提供了三点建议:

  第一,业务需求与分布式数据库的匹配度。包含两个方面,一方面是功能匹配度,包括数据库功能支持范围(如协议支持、语法支持、功能支持及扩展功能支持等等)和业务适配分布式数据库的改造代价;另一方面是非功能性匹配,需要考查数据库的扩展能力、并发吞吐能力、访问时延、故障容灾高可用能力和数据安全保障能力等方面;

  第二,业务迁移成本。需要考虑新业务迁移到分布式数据库的开发标准约束,原有业务迁移分布式数据库的过程中,如何保证数据的正确性,如何控制对业务的影响范围;同时,一般数据库迁移会保持一段时间的双系统并行运行一年甚至两年的时间,业务兼容分布式数据库和原有数据库的工程维护代价一般较大,原有数据库到分布式数据库间的数据同步挑战也很大;此外,还需要控制分布式数据库对硬件和环境的依赖成本;

  第三,业务运维复杂度。需要考虑分布式数据库运维平台的对接,考查分布式数据库自运维能力、审计能力、监控精确度和快速定位能力等。当无法自运维时,需要考查服务厂商后期能提供的运维服务和培训服务。

0
相关文章