数据库 频道

从“数据结构+算法=程序”到“数据+业务规则=应用”

  我上大学的时候学到的第一个主科的公式是程序=数据结构+算法。这个最为朴实的公式让我一生受益,在随后的几十年工作中,我无论遇到什么样的应用系统,不会上来就去看其细节,而是从数据结构和算法入手,无论是做应用开发还是后来从事系统优化,这套直达本质的工作方式让我面对无论如何庞大的系统,总是游刃有余。

  不过随着AI时代的到来,这套逻辑可能将会被新的逻辑颠覆。应用不再是依靠人定制好的规则运行,AI智能体将根据业务规则和对数据的理解,动态生成方案,并完成数据处理,达成业务目标。大多数应用也不再是为人类开发的,其使用者会变成智能体。除了一些面向交易和工业控制的系统之外,大多数的企业管理系统:OA、ERP、CRM、SCM、BSS、OSS等,其组成不再是功能模块为组织形式,交互形态也不再是仪表盘、数据表格。整个系统的运作不是流程驱动的,而是目标驱动的。流程将会被整体优化,更加适应智能体,更加高效,只有关键环节才需要人类参与或者干预。

  应用系统的交付形态也不再是标品交付或者半成品交付+现场定制,而变成全生命周期交付,即随时交付,动态发展。应用系统中的关键能力能够不断被优化和扩充,但是不再需要v1.0/v2.0的断代式的升级。当系统有了初步的原型的那一刻开始,系统就处于可交付状态了,不过在系统上线后,仍然可以大规模迭代,有时候一个新的功能或者工具仅仅需要几个小时编写Skills,补充相关工具,简单点的业务一天之内就能上线,复杂点的可能花上几天时间验证后就可以上生产了。工具开发、测试也不再是人肉模式,本系统中带有一个特别懂业务的智能体,可以快速补充系统中缺少的工具。应用系统完全围绕真实的需求,不再是花架子。以往需要大量反复填报的场景会大大缩减,智能体能自动从所需的数据源去获取或者复制数据。

  未来的应用面对的数据与我上学时学习的程序的公式也完全不同了,不管是结构化数据、半结构化数据、非结构化数据,包括多模态的数据,可以在一个数据处理引擎里进行处理,数据+业务规则,在这个数据处理引擎里加工后就实现了系统的功能。

  面对这样的应用系统,传统的数据库将面临新的挑战。什么Oracle数据库兼容性、复杂SQL的性能,都退位为次要的问题。全新的数据处理引擎通过企业知识库了解到每个业务逻辑的底层数据逻辑,能对业务和数据进行精准的溯源,因此这个智能化的数据处理引擎可以用最简单的方式通过cli tool或者mcp tool精确地找到其所需要的各种类型的数据,这里的数据不再是结构化的数据,也包含理解和处理数据的语义。然后像人类一样去做思考,AI强大的算力既能像人类专家一样理解数据的语义,而且比人类有更强大的算力,可以更加高效与精准地处理数据。

  目前几乎所有的国产商用数据库主要都是面向关系型数据处理的 ,哪怕支持了大量的多模态的数据处理能力,其特性还是基于传统的规则化计算的,其提供的核心接口就是SQL。在未来的AI应用场景中,这种计算只能解决一小部分的业务问题。因此以前占据IT基础设施核心位置的大型关系型数据库就会被边缘化为一个小小的数据源。SQL也会从业务规则的核心实现技术退化为一种数据获取的方式。

  试想一下,如果这种情况出现,大家还有理由花大价钱去购买商用数据库产品吗?那么多不错的开源产品,随便选两个就够用了。从这一点上看,国产商用关系型数据库的危局已现。最近我和几个国产数据库厂商的朋友探讨过这个问题,有些朋友已经在思考这个问题了,有些则还无动于衷。传统的商用数据库如果未来还想占据IT基础设施的核心地位,那么只有变革这一步了。

  数据库一直被定义为数据存储和处理的核心IT基础设施,那么为什么就不能成为那个用上帝视角去看数据的新一代核心而非要偏居一隅呢?关系型数据库系统的架构和形态为什么就不能做个大的变革,而还是维持那个几十年不变的形态呢?存储引擎、计算引擎之外,为什么不能加入一个推理引擎呢?除了SQL这样一个核心计算引擎之外,为什么不能提供一个更强大的数据处理引擎呢?我想这些问题都值得数据库人仔细想一想的。6月25号,我受约参加南大通用GBase的数据库技术大会,在会上我将会分享一些我在这方面的所思所想。

0
相关文章