数据库 频道

2024年中国数据库市场风云:AI 搅局,国产加速,整合在即?

2024年,中国数据库市场进入快速发展的关键一年,有确定性也有新的变数。

比如,AI的热潮涌入了数据库领域,向量搜索基本成为数据库的标配,数据库产品因应GenAI时代变革,积极拥抱AI。又如,第二批通过“安全可靠测评”的数据库名单也终于在9月30日发布,靴子落地,国产化进程将加速,而“收敛”、“整合”也提上了日程。

2025年新年伊始,ITPUB采访了多位专家,从技术、商业、生态三个维度对2024年中国数据库市场的发展进行盘点与展望,希望能给您一些启发。让我们共同努力,一起推动中国数据库创新发展。

技术、商业、生态多维度解读中国数据库市场发展

技术方面:GenAI变革、多模一体化、多云原生

1、GenAI变革:AI4DB和DB4AI

随着大模型不断发展,因应GenAI时代的变革,各数据库厂商都在增加AI4DB和DB4AI的研发投入。如果说2023年数据库与AI的融合更多是在概念、基础准备和探索阶段,那么2024年已经有一些应用场景落地。

在AI4DB方面,技术逐渐落地,赋能开发和运维。

交互方面,大模型的能力在文本处理的优势更加明显,在结构化数据模型上,依托大模型技术,Text2SQL能力相比过往进步巨大,且大幅度降低技术实现门槛,虽然还要面临诸多准确性、可解释性等问题。但由于实现成本极低,Text2SQL会成为2025年数据库的标配能力。关于SQL在大模型技术下是会被其他语言标准颠覆,还是会扩展升级,则还需要时间观察。不过有专家指出,SQL作为图灵完备的语言,在GenAI时代,或有更大的发挥空间。

运维方面,数据库引入大模型等AI技术,实现自动化调优、智能预警、故障预测、根因分析,使数据库更加智能化,在降低运维成本的同时,提高数据库的稳定性和性能。目前这部分更多还需要依赖DBA专家的经验,做最后一公里的确认,但仍然可以辅助一些DBA专家。智能化运维的应用依赖于数据库采集的各项丰富的多维度数据和指标,数据、指标的积累国产数据库与国际领先产品还存在较大差距。有专家认为数据库运维是相对低频操作,且稳定性大于一切。AI 在这方面能节省的人力成本相对有限,且由于自身的“概率”基因,也与要求极度“严谨”的运维操作相违背。因此,以现有的大模型技术能力仍然不足以在严肃的运维场景下得到应用。

在DB4AI方面,伴随着大模型发展对市场的带动,数据库层面也开始面向 AI 场景提升自己的能力和探索,比如Vector Search成为传统标配能力。Forrester的一项新研究发现,到2026年,75%的传统数据库(包括关系型数据库和NoSQL数据库)将在其产品中加入向量功能。

根据IDC发布的《RAG与向量数据库市场前景预测》,向量数据库市场主要由GenAI带动,多为大模型服务项目总包中的一部分,仅有少量商业化解决方案落地。为了提升大模型的准确性,RAG已经从最简单的向量索引+LLM,发展出了GraphRAG、结合全文索引等多路召回的方案,也有一些数据库产品正在探索增加Graph、全文检索的能力,以应对AI的发展需要。

当前DB4AI的发展存在两大难点,一个是多模态技术实现问题,一个是在应用场景层面会遇到挑战,AI的落地需要一个过程。

有专家认为,目前,AI4DB/DB4AI实际上还在传统数据库技术理论层面打转,真正的数据库技术挑战来自于AI是否有可能重塑数据库技术,颠覆数据库存在的形态。AI技术会直接影响到整个软件产业的设计、开发、运维等层面,也会从底层对国产数据库产生一定的未知影响。

2、多模一体化

随着Data+AI的进一步发展需要,数据库也越加强调自身在大模型应用场景下的多模态特性。越来越多的厂商开始重视并增强多模态数据处理能力,面对日益复杂的数据类型(如文本、时序、地理空间、图像、视频等),市场上出现了更多支持多种数据模型的数据库产品,帮助企业更好地管理和分析不同类型的数据。

多模数据库处理的一体化数据库可以降低用户成本,成为未来趋势。专家指出,多模一体化正在由过去单纯的多数据模型存储进一步向着一体化融合查询发展,目前一些国产数据库已经初步具备了融合查询能力,但是与国际领先产品还存在差距。

近两年,一体化融合在数据库在架构层面也取得了发展,比如单机(集中式)分布式一体化的发展为企业带来更灵活的选择。此外,HTAP混合负载支持已经成为新一代数据库的标配,并逐渐成熟,HTAP技术不仅提升了数据处理效率,还满足了企业对复杂分析场景的需求。

3、多云原生、Serverless

近两年,中国公有云数据库市场加速发展,占比超过60%。据CCSATC601最新测算,按数据库部署方式划分市场规模,2023年中国公有云数据库市场规模为320.15亿元,较2022年增速46.1%,公有云市场规模占总市场达到61.3%,2023年公有云数据库市场规模进一步扩大,预计2024年公有云市场占比将进一步扩大达到64.4%,规模达到385.8亿元。

企业对云原生的数据库的接受程度越来越高,各厂商都在利用云计算的优势实现资源的弹性扩展和高效利用。对象存储正成为新的数据库基础设施,云原生技术将继续推动数据库服务的灵活性和可扩展性,满足企业快速变化的需求,尤其是Serverless数据库正在越来越多敏态业务落地发展。

企业在做云数据库选型时,现在更加通盘考虑整体的IT方案,云数据库只是整个IT方案中间的一环,当考虑整体IT方案时,多云原生变得越来越重要,可以避免供应商锁定,以及充分发挥不同云的优势,企业会关注数据库云中立、与哪些主流云做了适配、在不同云中自由灵活切换、跨云灾备等方面的能力。

4、内核需要更细粒度的资源管控,更高的性能与稳定性

数据库从“能用”到“好用”的转变,需要一个稳健的数据库内核支撑。随着国产数据库在功能、性能等方面的能力基本就绪,内核到了需要更加精耕细作的阶段,需要更细粒度的资源管控能力、更高的性能与稳定性,尤其是在一些需要高性能的高端场景,国产数据库还需要不断强化。

商业方面:国产升级加速但部分领域不及预期,出海掘金

1、国产升级加速

2024年中国数据库市场发展整体加速,国产升级进程整体加速。据CCSATC601《数据库发展研究报告(2024)》的最新数据,中国数据库市场规模为74.1亿美元,占全球7.34%,云数据库市场规模占比超过一半,数据库供应商数量为167家,产品数量达到269款。

在我们与专家交流中发现,部分行业发展与预期相当,稳步发展,但是部分看好的商业领域,发展不及预期。比如,在党政、电信运营商、交通等领域,国产数据库市场稳步推进。但是在大家普遍关注的金融核心系统替换方面低于预期,而在医疗、教育等公共服务领域,与早期市场强劲的期望和开局还是有一定距离,这也让一些早期布局的国产数据库企业遭遇了一定的挑战。

专家分析认为,一方面,国产升级走入了深水区,核心系统替换更为复杂、难度高,替换时相对谨慎,另一方面,在“安全可靠测评”的推进过程中,也存在一些观望情绪。随着国产数据库支撑更多核心系统平稳运行,积累了更多经验,以及“安全可靠测评”名单出炉,未来,国产化替代工作会进一步释放加速。

随着分布式数据库的应用逐渐增多,用户加深了对分布式数据库的能力认知,对分布式数据库的使用也逐渐趋于理性,“分布式不等于先进,集中式不等于落后”,会根据不同的场景需要选择合适的数据库产品。当前,集中式数据库共享存储集群(类RAC)的发展,也很好地支撑了一些关键行业的核心系统。整体来看,分布式数据库还处在发展的早期,系统复杂度、用户认知等方面还需要增强优化。国产集中式数据库在多写多读、对等共享存储集群技术等方面与领先国际产品还存在差距。未来,国产集中式数据库与分布式数据库会在各自适合的场景继续发光发热。

2、市场分化加速向头部厂商收敛

市场分化加速向头部厂商收敛,随着“安全可靠测评”工作的逐步开展,通过测评的数据库会逐渐增多,但不会改变数据库收敛的趋势,企业盈利能力差距会逐步放大,竞争日趋激烈,数据库企业数量会逐步减少。一些中小数据库因未通过“安全可靠测评”,考虑进行转型。

种种迹象表明,国产数据库的整合序幕即将拉开,部分数据库厂商正在寻求潜在卖家或买家。出现收并购是市场走向成熟的标志,资源整合也将进一步促进中国数据库良性、健康发展。

3、寻求出海发展

为了寻求更大的市场发展空间,避免在国内死“卷”,一些中国数据库厂商寻求出海发展,通常,开源与云是数据库出海的两大引擎。近两年,一些数据库厂商跟随核心企业、行业ISV出海发展,或者将中国的一些行业优秀实践(互联网金融、新零售等行业)向海外输出,获得了东南亚、日韩、北美、欧洲、中东等地客户的认可,专家们普遍认为中国数据库出海发展高于预期。

生态方面:开源生态加速,商业生态尚在初期

1、开源生态加速

开源生态为国产数据库的发展提供了重要支持,然而,当前仍存在开源生态不成熟等问题,制约了国产数据库的发展。不过近两年,开源生态的发展在不断加速,在社区治理、社区基础设施等方面初步完善,社区活跃度也有了起色。

2、商业服务生态刚起步

商业服务生态尚在初期,目前国产数据库商业服务生态发展刚刚起步,与国际厂商相比,国产数据库的生态系统中合作伙伴数量较少,上下游生态链不完整。一些原来国际产品的第三方生态服务商转向国产数据库第三方服务,也有一些新的第三方服务厂商加入,但是并没有获得可观的收入,主要是因为国产数据库的发展整体还处在早期发展阶段。

随着国产化进程加快,国产数据库在金融等一些关键领域的竞争态势逐渐明朗。“当前已经到了生态服务厂商一个比较关键的决策点,到底跟随哪些国产数据库有前途?需要尽可能聚焦,赚钱的好日子在后面。”有专家指出,数据库生意需要长期主义。

3、上下游伙伴生态及人才培养

推动数据库生态发展的关键在于统一标准、集成应用和系统兼容等方面。国产数据库厂商需要加强与高校、行业协会及上下游企业的合作,共同构建完善的数据库生态体系,这一趋势的发展速度基本符合预期。

人才培养是推动数据库生态发展的关键因素之一,而当前人才短缺问题依然严重。各数据库厂商都比较重视教育培训,正在加大投入,目前还没有达到很好的效果。但是我们也看到,越来越多的DBA愿意花钱去参与国产数据库培训认证,人才培养的发展趋势整体向好。

小结:以自研创新谋发展,差异化竞争、合作共赢共建繁荣生态

如今中国数据库发展取得了一些可喜的成绩,正行进在从“能用”到“好用”的路上,但是仍然面临着一些挑战,专家们也给出了一些建议:

  • 国产数据库市场整体碎片化严重,资源分散,难以形成合力,市场的整合收敛有望改善。希望国产数据库厂商可以找准自己的定位,脚踏实地自主创新,不要搞开源套壳圈钱,打造差异化,避免同质化恶性竞争,共同打造良好、健康、可持续的中国数据库市场发展环境。

  • 核心技术积累不足,尽管国产数据库在性能和功能上有了显著提升,但在某些关键领域,大多数国产数据库在如查询优化、高可用性和扩展性等方面,与国际领先产品仍存在差距,在稳定性方面,大部分国产数据库缺乏极致严苛场景打磨的经验,还需要验证,而在易用性方面,差距更为明显,需要很多工作要做。

  • 商业层面,相比国际品牌,国产数据库的品牌影响力和市场认知度较低,用户对其技术和可靠性存在疑虑。

  • 开源数据库与非开源数据库在市场上形成了互补态势,满足了不同用户群体的需求。开源数据库以较低的成本和丰富的产品吸引了大量用户,而非开源数据库则在知识产权和信息安全方面具有优势。部分厂商在开源数据库的基础上进行商业化,但如何在开源社区和商业化之间找到平衡,仍然是一个挑战。

  • 生态方面,开发者生态(包括开发者工具、文档和支持资源等)、合作伙伴生态、人才培养与储备等方面还需要不断加强、完善。

  • 出海发展,从0到1建立信任最具挑战,中国数据库厂商在出海初期,可能要在强化服务以弥补产品认知的不足,逐渐获得客户的认可。此外,全球合规问题也是需要着重解决的问题。

  • 有专家建议“安全可靠测评”评价体系需要更加完善,比如企业自用版弱化其商业化发展指标,如此企业自用与独立商业厂商的发展可以两全。

写在最后

数据库需要长期主义,日拱一卒,功不唐捐。这么多从业者的拼搏和奋斗,让我们对中国数据库市场的未来发展充满信心,在文章的最后,感谢

等专家带来的深刻洞察与思考,在大家共同努力下,相信中国数据库市场以及中国数据库产品能够有一个更好的未来。2025年,一起加油!!!

1
相关文章