数据库 频道

运维数字化转型后为什么更累了

前阵子听一个朋友吐槽他们搞运维数字化转型后,非但没有觉得工作轻松,反而被搞得整天筋疲力尽的。因为数字化转型,他们引入了普罗米修斯,又从网上找来一大堆插件,把公司里的各种可监控的组件都接入普罗米修斯监控了。又上了日志平台,接入了应用服务器、数据库等的日志。折腾了大半年,总算是告一段落了。

这段时间的成果也是很喜人的,因为以前IT部门上监控的东西不多,完全靠人去管理。很多事情都要手工操作,因为系统数量比较多,因此管得也比较粗犷,只要业务部门不投诉,系统没宕机,也基本上没人去管。因此他们运维部门各个专业十来个人倒也还能应付过来。这段时间上监控,接入数千个运维对象,累了个半死,总算是弄消停了。系统都上了监控以后,确实比以前方便了不少,一些日常要做的手工检查工作也都可以借助系统完成了。

不过好景不长,领导看到第一阶段成果后,立马开展了提质增效的工作。这下子问题大了,日志都采集过来了,你总要分析分析有没有问题吧,数据都采集上来了,告警基线也都搞好了,每天产生的告警总要分析分析吧,闭环管理肯定是领导喜欢的工作,当日对于运维人员来说,可能意味着写不完的报告。

有个用户从上了我们的D-SMART后,他们的 领导也学会了看数据库、中间件等的运行状态,因此他也经常登录到系统中去看看健康分和未恢复告警。一旦看到某个系统的健康 状态是黄色的,或者告警中还存在未回复的严重告警,就马上会让一线人员去检查分析,实现闭环管理。实际上很多问题并不一定是马上要解决的,但是领导不管这些。于是他们只能调整模型,让健康分起码处于绿色区间,告警也只能调低级别,让它不出现在监控告警台上。

另外数字化转型后,运行状态有没有提升的问题是不是也要每周做个总结呢?有些东西只能从网上找些小工具来输出一些分析结果,有些实在找不到工具的就只能靠人手工去看。部门的数字化管理能力提升之后,好像活也变得更多了,提质增效四个字前面两个字是不是做到了不太清楚,后面两个字似乎并不存在。因此他对于运维数字化转型是否能够真正地提质增效产生了怀疑。

其实很多企业搞数字化转型,没有从根本上去考虑数字化转型的目的,而是当成一个政治任务来搞,别人都转型了,我们不搞不行了。压根没有搞明白数字化能提质增效的底层逻辑是什么,也就搞不出提质增效的效果来了。数字化建设也不是大跃进能干好的,必须基于以往信息化的基础的,通过信息化,精益化,自动化,智能化这几个阶段的发展,才能真正地完成数字化转型。通过精益化管理,引入自动化工具,再利用智能化手段辅助分析,可以把管理触角延伸到以前无法触及的地方,大大扩大运维部门可管理的范围,从而达到提质的目的。通过自动化、智能化的手段实现大量的自动驾驶,无人化值守,数据自动汇集与分析。这样才能节约大量的一线运维人员的工作量,从而达到增效的目的。提质增效二者必须同时达成目标,才是可持续的,才是真正实现提质增效。

很多企业在IT运维的信息化阶段欠债太多,想要实现数字化转型,那么就先要把欠债都补上才行。实际上运维的数字化转型也是需要一步步前进的,走得太快了就容易扯着蛋了。

今天的这个例子中,他们引入普罗米修斯和日志平台,将以前全靠人工运维的系统都接入进来,把数据都采集上来,这个工作做得是相当不错的。只不过,这部分工作仅仅是补上了信息化的欠债,是为数字化转型铺路的。领导错把这些前期工作当成数字化转型的核心工作了,因此在完成这些工作后,就迫不及待的上管理,搞KPI了。确实也是,领导们不是搞技术的,只有看到KPI才算有成果,因此往往会过于急迫。

数字化转型后,运维部门面对的数据可能数十倍数百倍于以往,因此数据处理必须实现自动化和智能化,如果依靠人力去分析数据,那么和用算盘算原子弹的爆炸当量的工作量有一拼了。很多企业领导只看到了数字化带来的管理能力的提升,而忽视了数字化首先应该实现生产方式和生产力的提升,实现一线工作的提质增效。一线工作必须在数字化工作的帮助下提升效率,才能够实现质量的提升。只有效率提高了,质量提升了,管理才有可能水涨船高。

不过很多企业往往缺乏耐心,完成数字化采集阶段的工作后,企业本应该加大投资力度,引入自动化、智能化的手段来处理数据,构建各种模型与算法,将一些原本需要一线人员手工完成的工作变成数字化,自动化,从而将一线人员从繁重的数据采集、数据统计、数据分析等工作中解放出来。这样一线人员才能有更多的时间参与到KPI的提升工作中来。

这种情况产生的最主要原因是这些企业做运维数字化转型的出发点和目的都错了,没有从解决一线生产的问题入手,而是从管理的角度入手了。这么做下去,一线人员并没有因为数字化而受益,反而为了数字而疲于奔命了。不幸的是,很多企业的运维数字化转型,走的是这条完全错误的路线。

0
相关文章