数据库 频道

领域大模型+专业经验+推理能力构筑DBAIOPS的基石

昨天写了一篇关于DEEPSEEK-R1的文章,实际上我昨天上午就下单通过国补5500买了一台带4060独显的神舟笔记本电脑,用来进行相关的研究。在南京我有一台带一块3090的台式机,不过最近回不去,在深圳只能临时搞一个平台来做一些研究了。DEEPSEEK的意义在于可以低成本高质量的玩AI,AI应用场景会爆发式增长,前两年雷声大雨点小的大模型应用可能会进入一个快速发展期。

其实两年前我曾经尝试用大模型构建AIOPS的模块,但是最后还是放弃了。虽然大模型推理在SQL优化,执行计划分析等方面取得了不错的效果,但是在其他领域的效果一般,只能作为一个玩具玩玩,无法实现商业价值。DEEPSEEK的出现改变了大模型在数据库智能化运维领域的态势,因此我必须重新思考一下如何利用生成式AI来进一步发展我们正在做的DBAIOPS了。

基础知识(领域大模型)+专业经验+强大的推理能力是构建DBAIOPS的一种可行的渠道。以前我们在D-SMART中用了运维知识图谱+图谱推理来实现智能化诊断,寻找故障的根因。当时最大的问题是推理能力和归纳能力有限,只能产生一个方向性的指导结果,这个结果只能给专家提供参考,无法特别明确地指出问题。基于DEEPSEEK,可以形成一个更好的方案。

针对基础知识:目前的DEEPSEEK-R1 671B的基础能力已经很强,32B、14B也表现出了很强的数据库领域的基础能力。不过这些都只是通识大模型,给予DEEKSEEK-R1,通过蒸馏等方法可以低成本地开发出数据库领域的高质量领域模型,这些模型中就包含了较为完整的数据库方面的基础知识。

专业经验:专业经验是针对运维的专属经验,从专家和运维实践中可以大量获得,这方面我们在做D-SMART产品的这几年里,已经在大量的积累。随着应用场景的更大范围的覆盖,专业经验的积累也会越来越深厚。专业经验是动态变更的,可以采用RAG嵌入的方式嵌入到专业大模型中。

推理能力:DEEPSEEK-R1的中文推理能力很强,哪怕是deepseek-r1:7b都表现出了相当强大的推理能力。这一点解决了以前我们基于知识图谱做诊断分析,无法深入归纳,给出很直接的答案的问题。

昨天我在新买的4060显卡的电脑上部署了一套deepseek-r1:14b,并做了一个简单的测试。

当关闭互联网搜索,并且没有运维知识嵌入的时候,回答的结果是不太靠谱的,甚至存在比较严重的错误。

于是我嵌入了一段REDO LOG相关的知识。效果马上改观了。

但是可以看出结果依然不够准确,REDO LOG 文件过大这个说法肯定是不靠谱的。

我继续优化嵌入的知识,其回答的质量越来越高,已经相当靠谱了。后来我打开了互联网搜索,推理的质量更高了,不过也引入了少量错误的观点。这方面也说明互联网上的运维经验更加丰富,不过有些良莠不齐。

通过这个简单的实验,让我思考了许久。首先基于deepseek-r1去实现更加强大的分析推理,是完全可行的。其次是AIGC并不是万 能的,并不是部署了一套deepseek,就可以解决AIOPS的主要问题了,高质量的运维经验依然是实习那AIOPS的关键,在这方面还是需要投入巨大的资源才行。高质量的数据库领域大模型依然是AIOPS 实现中成本最高的,不知道哪个大厂能够率先做出一个并开放给公众免费使用。

0