技术开发 频道

胡永:联想集团IT监控体系架构变革之路!

  【IT168 评论】在全球500强企业中,联想排在200位左右。对于联想,大部分用户更熟悉的可能是其电脑和移动业务,对于智能设备和云应用相对陌生。目前,联想已经发展成为全球领先的智能设备及企业IT解决方案提供商,其业务遍布全球160多个国家和地区。随着业务复杂性的增加,联想的IT监控体系也发生了很大变化......

  早在2010年,联想在物理机监控层面已经相当成熟,但很快联想就意识到再成熟的物理机监控也抵不住现实需求的变化,随之转向了虚拟机,而后又快速变为私有云平台。谈到IT监控,我们可以想到事件监控、业务监控、技术监控、网络性能检测与诊断甚至是其上的数据分析和可视化平台,本文嘉宾——联想集团监控高级经理胡永将带大家了解联想集团IT监控体系架构变革之路。

联想集团监控高级经理胡永

  1、新技术堆栈的出现逼迫企业监控体系必须转型!

  30多年来,联想见证了无数技术的兴衰存亡,经历了多轮技术堆栈的变革。云计算、容器和微服务出现,尤其让变革的脚步加快。传统的监控体系无论外界环境如何变化,虚拟机都可以支撑,但是容器和微服务的出现让应用增长加快,企业迫切需要动态、弹性的体系架构。

  在这种情况下,传统的监控方式难以掌握企业应用全场景的性能情况,联想内部业务线复杂,应用系统就有几百套之多,基础架构十分庞大,数据呈指数级增长。一旦系统出现性能问题,与之关联的每一部分都可能是影响因素,难以快速定位问题原因。此外,虽然联想具备自己的监控体系,但是内部技术人员往往仅专注于单一领域,无法应对DevOps等新技术对IT体系架构的冲击。

  自2016年开始进行数字化转型,联想一直在寻找更加成熟的全栈式监控方案,以解决上述面临的一系列挑战。

  2、联想整个IT监控体系发生变革!

  2013年,联想正式在监控体系中加入了Dynatrace的产品,针对部分重要的前端系统部署了监控。联想监控体系分为事件监控、事件分析和可视化三层,对于云或者外网用户采用主动拨测的方式,对于内网用户,使用开源工具监测应用性能和可用性,其他部分使用Dynatrace方案。

  联想监控体系包含监控发现,数据分析以及可视化

  胡永表示,联想主要使用Dynatrace分析网络数据并定位故障,将应用性能可视化展现出来。Dynatrace方案可以帮助定位故障域和进行全面诊断,以及追溯代码级别调用所带来的性能影响。

  3、智能化全栈式监控体系如何理解?

  Dynatrace可以帮助用户去厘清性能监控层面的两大技术难点——全栈式监控和应用程序依赖关系梳理,其价值就在于可以通过一张报表清晰的展示出全部应用性能状况,非技术人员也可以一眼看懂。

Dynatrace Smartscape

  Dynatrace采用人工智能技术的智能分析和警报,全自动提供性能问题的原因

  对于用户而言,最向往的就是“傻瓜式”应用;对于IT体系监控而言,智能化的加入简化了整体流程。即便是性能监控工具,Dynatrace同样做到了极简部署, OneAgent的部署简单快速,并且可以全栈式抓取应用的所有信息,这只是Dynatrace智能化之路的开端,其可以自动梳理应用之间复杂的依赖关系、上下游关系,将应用之间的通信交互等信息清晰呈现,并可以智能化运维预警部分简单问题,提升运维人员的工作效率。

  Dynatrace的价值:全栈式监测、快速部署、智能定位故障根源和关联关系分析

  未来,性能监控必将越来越智能化,运维将越来越简单,这不仅仅是所有IT运维人的愿景,同样是性能监控必然的发展趋势。

0
相关文章