数据库 频道

简单聊聊数据驱动的语义化知识图谱

  经常有朋友问我,你常说的语义化知识图谱是个什么东东。也曾经有朋友质疑我们搞语义化知识图谱的必要性:“AI大模型越来越强,今后所有的知识大模型都知道了,你搞这个语义化知识图谱,会不会未来就没啥价值了,CLAUDE CODE是不是完全可以把你们搞的这个东西替代了?"。

  回答第一个问题其实很简单,最通俗的方法来描述“语义化知识图谱”就是将专家级的语料有序组织起来,可以方便地被智能体获取到,用于理解某个业务的背景知识和数据分析技巧。知识图谱的存储模式可以是多种多样的,可以是图数据库,也可以是向量库,也可以是关系型数据,甚至可以是文本。在一个系统中,也可能采用混合模式来存储数据。而数据驱动的语义化知识图谱则在专家级语料的基础上增加了数据的视角,专家级的语料顶多能提供一些分析思路,但是无法实现分析的自动化,也无法直接给出答案,只能让我们知道一些可能性。有了数据的加持,AI自主推理就成为可能了。

  回答第二个问题稍微麻烦一些,因为我都不确定AGI什么时候会到来,我个人的感受是AI技术的发展已经远超我的预想,目前初级的AGI已经出现了,我个人感觉目前的Claude Code、CodeX、Hermes等技术框架已经是一种AGI的雏形了,未来朝着这条路线发展,潜力无限。我记得80年代末在计算机科学系上《程序设计语言》这门课(这门课不是讲某个语言,而是将计算机程序设计语言的发展历史和基本原理)的时候,我曾经问过授课老师:“人工智能真的能实现吗?”,当时的任课老师的名字我已经记不清了,当时只是一个讲师,不过他师从名师,水平是相当高的,我至今仍记得他的回答:“当计算机会自己写程序的时候,人工智能就真的成了”。三十多年后,我们终于来到了这个时间点上了。

  虽然AGI已见曙光,但是我觉得对于所有的专业领域而言,高质量的专家级语义依然是不可或缺的。我们先来看一个例子。

  我来问一个前阵子客户现场遇到的故障情况,使用的模型是Qwen3.5。不过回答的内容还是比较笼统的。

  上面的回答中规中矩,问题在于仅仅罗列了一些专业知识,并没有针对性的从服务器IO性能正常,SQL响应慢,IO队列积压这三个关键点去分析问题。我们再来看看基于我们的“语义化知识图谱”的专业语义的回答:

  

  可以看出,上面的回答更加聚焦,并且完全可以交给AI,让AI去做自主分析了,哪怕是DBA根据这个报告去自主分析,成功的可能性也更高。而直接去问大模型获得的回答,只能作为专家的参考,甚至非专家不能懂,一些对OB运维方面的能力不够的普通DBA,哪怕看了报告也很难上手去做分析。从这个例子可以看出,语义化知识图谱是AI自主运维不可或缺的。

0
相关文章