前几天一个朋友推送给我一个关于AIOPS标准:云计算智能化运维(AIOps)能力成熟度模型(T/CCSA382.2-2023),和我讨论这个模型有什么用处。对于成熟度模型团标我以前也略知一二,国内有一些IT服务类的能力成熟度模型团标,和系统集成服务能力成熟度模型、软件成熟度模型SEI CMMI一样,这些成熟度模型都是用于评估一个组织在某个领域的专业程度的。此类团标建立以后服务供应商一般会按照标准优化服务产品和管理流程,提高这个方面的技术、管理与服务的能力。同时会有专业机构从事成熟度评估服务,颁发证书。而这个证书的初衷是让选择这些服务的客户能够了解提供服务的企业在这方面的能力水平级别,最终这些证书可能会被用在招标等工作中,作为选择服务供应商的依据。
在IT服务领域,因为企业用户的特点多样,需求多样,因此这个虽然已经存在了多个服务能力成熟度模型存在感一直不高。特别是在IT运维工具领域,大家都是看工具能不能真正帮助到运维人员,能否减轻运维人员的工作负担,很少有企业会关注哪个标准可以帮助企业判断哪个工具可能对某个企业的运维更有帮助。不同的企业、不同的运维团队、不同的运维模式、不同的企业文化,都会影响运维工具的选择。
昨天在DBAIOPS服务群里,一个用户说:“我们目前不需要标准版的功能,社区版就够用了,因为我们有专业的运维人员,只需要使用D-SMART里的告警功能”;而另外一个用户则说他们更需要的是当问题出现后,能够帮DBA整理思路的辅助系统。
目前在IT领域已经存在不少能力成熟度模型,比如全国信标委大数据标准工作组在2018年发布的DCMM(Data Management Capability Maturity Assessment Model,数据管理能力成熟度评估模型);中国电子工业标准化技术协会信息技术服务分会于2015年发布的ITSS.1-2015《信息技术服务 运行维护服务能力成熟度模型》 等都是此类模型。目前这些模型都已经开展了评级认证工作,证书也在一些招标项目中被使用。
服务能力成熟度模型虽然也存在一些被滥用的问题,不过总体上来说还是具有很强的正面效应的。第一个方面,模型可以指导从业组织完善组织架构和组织流程,从而提高从业组织的技术与组织管理水平。对于服务乙方,在选择服务供应商的时候,也可以依据从业组织获得的证书等级大体了解从业组织的服务能力与水平,从而制定筛选的入门门槛。
IT服务成熟度模型大多是有正面意义的,不过对于智能化运维成熟度模型标准的建立,我觉得现在还为时尚早。,因为AIOPS方面目前还处于前期探索阶段,连靠谱的能落地的方案都没几个,能够真正提供服务的企业也不多,目前正在实施的方案也千差万别,很难找出共性来。针对这样一个技术、方案、交付标准都还不够成熟的IT服务细分领域,目前阶段怎么可能搞得出成熟度模型来呢?我对做这件事的必要性和可行性,都是持怀疑态度的。起码在数据库领域,我还没看到过真正靠谱的AIOPS来。我做了6年多的D-SMART也只是一个运维知识自动化系统而已,只是因为现在不带点AIOPS都不好意思说是做运维工具的,才给它归类到AIOPS工具里去,实际上它离我心目中的DBAIOPS产品还有很远的距离。
我觉得目前还没必要做这个能力成熟度模型的另外一个原因是从技术层面考虑的,从技术层面上真的能做出一个靠谱的模型出来吗?国产数据库目前已经有近300家企业了,本身关系型数据库也已经发展了四十多年了,为什么现在数据库没有一个技术能力模型,对这些数据库厂商和数据库产品做个评估呢?从全球范围内只有数据库流行度,有魔力象限这样的第三方评估,而从来没有哪家国际机构敢对数据库产品做一个综合的排名。在基准测试领域,目前也只有少量的评估方案,比如TPC-C/TPC-H,但是为什么没有出现一个可以给国产数据库发技术等级证书的标准呢?这是因为数据库技术的复杂性以及数据库产品针对复杂的用户场景的适应性都太复杂了,评测机构的技术能力目前还无法达成这类的评测。
在技术层面上,AIOPS领域大家目前都在做探索,还没有出现特别牛的,能够在通用场景中高效解决问题的AIOPS解决方案出现,需要广大从业厂商更自由地探索新的技术方向。因此正是要鼓励百花齐放,自主创新的时候。对于一个尚未成熟的技术,就开始通过制定成熟度模型标准来规范行业发展,评估从业组织的技术能力,是不是有点过于超前了。
通过一个团标把AIOPS的功能、能力范围框死了,不仅无法筑牢底线,反而容易框死了发展的上限,让这个行业的技术发展与能力发展禁锢在模型里。因为一旦这个模型全面推广开来,那么肯定会被一些企业用来党同伐异。因为这个模型做好以后,评估认证,发证书,增加招标门槛这一系列操作肯定是随之而来的。这就逼着一些企业不自觉地把自己的服务产品往这个模型上靠,最终扼杀创新。