数据库 频道

全球增速最快,一个国产数据库的内外兼修之路

随着国产化进程加速,竞争加剧,中国数据库市场正开始收敛,出海成为不少厂商的选择。国产数据库如何做到内外兼修?正在变成一个热门课题。

自成立之初就将自己定位为全球化数据库厂商的 PingCAP,在海外市场以及中国本土市场都取得了不错的成绩,获评 Gartner 云数据库市场领域“客户之选”, 并成为全球数据库管理系统市场增速最快的厂商。近期,我们采访了 PingCAP 产品和市场负责人,聊了聊他们对中国和海外数据库市场以及数据库技术发展趋势的洞察。本文可以作为 PingCAP 中国与海外市场内外兼修的路径参考。

中国与海外双面开花

根据日前 IDC 最新发布的报告,2023 年中国关系型数据库软件市场规模为 38.0 亿美元,同比增长 10.8%。由于受到宏观经济放缓、企业 IT 投资紧缩以及汇率下降等多重因素的影响,2023 年中国关系型数据库市场增速达到历史最低水平。6 月,Gartner 发布的《Market Share Analysis: Database Management Systems, Worldwide, 2023》报告显示:“2023 年全球数据库管理系统(DBMS)市场的增长率为 13.4%,略低于去年的 14.4%,但仍然超过了整体软件市场 11.1% 的增长率。” PingCAP 以 97.9% 的增长率超越 Snowflake,ClickHouse 和 Cockroach Labs 成为全球数据库管理系统市场增速最快的厂商。

近几年,中国数据库市场百花齐放,百家争鸣,同时也越来越卷,很多数据库厂商选择出海淘金,寻求更多的增长机会,“中国本土 + 出海”两条腿走路成为越来越多中国数据库厂商的新常态。

成立于 2015 年的 PingCAP 是一家企业级开源分布式数据库厂商,自成立之初就将自己定位为一家全球化的中国数据库厂商。

PingCAP 副总裁刘松介绍,国内和海外市场环境不同,数据库市场的发展也存在很大差异,在中国和海外的发展策略也会有不同的发展路径和产品形态侧重。

在国内,国产化、分布式、云原生是数据库发展趋势,围绕国产化做分布式替换或改造升级,替换 Oracle 等数据库支撑业务稳定运行是刚需。始于原生分布式架构,TiDB 数据库产品定位是以 OLTP 为核心的 HTAP 数据库,首先通过泛互联网,银行、证券、保险的核心业务系统打磨锤炼产品的企业级能力,然后扩展到运营商,能源,制造,医疗,公共服务等行业,是其在国内发展的整体策略。

比如,在国内某国有大行,利用 TiDB 的 HTAP 能力替换了该行原有 Oracle+MongoDB+Hive 等数据库,升级为实时数据服务平台,支撑超过 10 年的数据查询,提供实时、一致的客户体验。TiDB 兼顾海量数据存储、大规模多源汇聚、多样化数据实时分析和多维度数据访问,简化 IT 架构,实现灵活高效的资源调配和精细化的降本增效,处理约 500T 业务数据,这验证了其大规模数据处理能力。

在海外,数据库的发展比较强调云原生,Serverless 和 AI 所代表的新技术。PingCAP 遇到很多企业希望对以 MySQL 为基础的上一代数据技术栈进行升级替换,刘松强调,TiDB 并不是 MySQL 增强版,而是 MySQL 兼容的新一代数据库。云优先以及强化 MySQL 生态支持是其在海外的技术发展重点,聚焦中大型客户的核心场景,尤其是数据量比较大的上百 TB 甚至 PB 级别业务场景,通过更精准的行业化做深用户,是其全球策略。比如在 Pinterest,TiDB 在 PB 级别的数据量替换了 HBase ,开启了一轮以 NewSQL 替换 NoSQL 的潮流。

经过 9 年发展,TiDB 在海量场景锤炼中不断成长,目前,PingCAP 在中国本土和海外市场双面开花:

自去年发布面向中国企业级用户的平凯数据库(TiDB 企业版)以来,PingCAP 在银行、保险等金融核心系统进行了规模化验证,锤炼了从产品到生态服务支持的全闭环能力,并在电信、能源、政企等更多关键行业得到验证,开启了规模化落地的新发展阶段。

在 Gartner 发布的云数据库市场领域 2024 Gartner® Peer Insights™“Voice of the Customer” 报告中,PingCAP 获评“客户之选”,是唯一获得该称号的中国厂商,也是中国独立数据库厂商第一次取得这样的好成绩。

可用性和稳定性是数据库的根本

整体来看,银行这样的核心系统对数据库的稳定性和可靠性需求有最高优先级,业务不能停,数据不能丢,其次才是性能。随着数字化转型深入,互联网化发展对系统弹性扩展能力也提出了更高的要求,原生分布式数据库成为新的主流选择。

PingCAP 首席产品经理姜皓楠介绍,银行核心系统对数据库有着非常严苛的要求,需要数据库具备准确性、高可用、业务连续性、可靠性以及高扩展性,原生分布式数据库在架构上比单机数据库天然更具有优势,分布式架构、多副本带来高可用、高可靠、数据一致性和弹性扩展能力。TiDB 在金融核心系统的应用实践表明,原生分布式数据库在大数据量复杂逻辑下的 OLTP 性能较分库分表、表组类分布式数据库更具优势。

2023 年 11 月,杭州银行成功上线了新一代核心业务系统,再次印证了 TiDB 在满足金融行业对数据库极致要求和工程化落地方面具备的整体实力。在新核心系统开发过程中,杭州银行没有对业务架构进行大量改造,实现了业务逻辑的平移。作为一款通用的分布式数据库,TiDB 不与特定的云平台和硬件绑定,满足软件工程的解耦要求,为银行核心系统的国产化提供一条可持续发展的平滑之路。

银行的业务具有可预期、周期性流量波动的特点,比如在日结、月结、季结、年度结算、发薪日等时期,都会出现流量小高峰,TiDB 的弹性扩展能力让业务以低数据库管理成本稳定度过高峰期,这也是很多企业机构选择 TiDB 的重要因素之一。

姜皓楠系统介绍了 TiDB 的产品治理理念,TiDB 坚持长期主义策略,产品沿着可用性和稳定性、产品基础能力拓展、功能性能力拓展几个方向逐步发展。

其中,可用性和稳定性是数据库的根本。TiDB 除了持续提升可用性,还会不断优化单点故障下的影响范围和自愈时间,以满足最严格核心生产库的可用性要求。在稳定性方面,会在资源稳定性和优化器稳定性两个大方向进行优化。TiDB 提出了分层资源保护机制,以确保在大量客户开放式使用场景下,产品具备兜底的资源保护框架,从而确保业务的连续性。优化器是一个需要长期演进和不断夯实能力的模块,其中统计信息采集、计划管理和代价估算模型优化是重点关注的领域。

姜皓楠介绍,集群稳定性分为两个层面,一是集群本身运行得稳健。二是一旦出现故障,控制爆炸范围和爆炸力度,对故障的控制和时效性是数据库很重要的能力,TiDB 提供的 Resource Control(资源管控)拥有更细粒度的资源管理能力。最新发布的 8.1 LTS 版本提升了大型集群的稳定性和易用性,引入了分布式执行框架(DXF)和全局排序等创新功能,并提升了快照备份的恢复速度,增强了集群的可用性。

产品基础能力拓展,包括性能、扩展性和容灾方案等方面的提升。扩展性不仅限于存储更多的数据,还涉及数据字典、内存结构和资源使用优化等多个方面的持续增强。

功能性能力拓展方面,TiDB 将逐步提供更丰富的函数支持、多模态数据类型支持、丰富的索引类型和更完整的诊断分析能力,面向开发者和 DBA 提供更好的用户体验。

长期来看,TiDB 要打造一个更健壮的数据库内核,也会让 TiDB 变得更好用,更易用,这需要结合用户真实场景不断持续优化迭代。

数据库未来获胜的关键是什么?

从技术层面来看,云、AI 是数据库的重要发展趋势,此外,数据库也一直向着提升易用性、降低使用门槛的方向发展。经过前期的验证,金融等行业的国产化进程将会加快。刘松认为,今年会是中国数据库市场逐步收敛的开始,未来一两年将会有明显的分化。

在本文发布之前,数据库圈关注到 OpenAI 收购云原生数据库 Rockset 这个事件,这代表AI 进入企业更需要具有实时分析能力的新一代数据库。TiDB 作为长期以分布式,HTAP,云原生为发展方向持续投入的公司,正好处在 AI 引发企业用户以新的实时方式访问数据的赛道上。

6 月 27 日,TiDB Cloud 发布向量搜索公测版,提供了一个功能全面且与 SQL 兼容的向量搜索解决方案,为 AI 应用开发者带来了便利。开发者现在可以轻松地进行创新和扩展,无需深入了解复杂的基础设施。

一款优秀的数据库是在真实场景中锤炼出来的,而不是单纯设计出来的,更广泛的用户触达获取用户需求变得非常重要。开源与 Serverless 是 PingCAP 触达海量用户的两大法宝,一些创新特性也可以率先在 Serverless 发布验证,加速产品迭代成长。TiDB Serverless 自去年 7 月发布以来,业务取得快速增长,活跃集群 3 万多个,付费用户超过 100 家。

“打造可持续的领先性是未来制胜的关键。也就是说,一家数据库厂商无论通过什么样的策略和市场行为,最终总能够抓到市场上最重要的需求输入,并且把它转化成产品核心能力。”刘松说,PingCAP 坚持长期主义,会脚踏实地走好每一步路。



0
相关文章