数据库 频道

数字化时代,重新思考IT运维价值

【摘要】数字化能为企业带来什么价值?传统ROI绩效指标与客户价值创造驱动的方式有何不同?进入数智万物的数字世界,技术本身的追求不应该作为金融公司技术团队的价值创造,而是应该围绕在企业价值下重新思考运维价值,由新的运维价值重新设计运维的数字化世界。

【作者】彭华盛,广发证券数字化运维研发团队负责人。超过10年的金融领域运维工作,期间负责参与企业运维组织、流程、工具的建设,包括各类重大业务系统项目与数据中心工程性项目的实施,数据中心标准化工作流程构建,运维工具体系的规划与研发、数字化转型研究与实施相关等工作,对金融领域的运维有较全面的理解。近年来专注数字化转型研究,探索推进数字化技术与业务转型双轮驱动的协同模式,推进业务数字化转型。平时喜欢研究新技术、新理念、思维模式、产品设计等等,乐于分享。腾讯TVP成员。个人公众号:运维之路

1 数字化时代己至

数字化战略上升到国家层面。2019年10月28日至31日召开的中共十九届四中全会上,审议通过了《中共中央关于坚持和完善中国特色社会主义制度、推进国家治理体系和治理能力现代化若干重大问题的决定》,决定指出:“要健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”。这是中央首次公开提出将数据作为生产要素参与分配,意味着数据从技术中独立出来,作为一种单独的生产要素而存在。这传递了两层含义,一是数据己对国家经济增长产生突出贡献,提升现有产品和服务生产效率,并创造全新的产品和服务;二是数据作为商品参与的产出分配与收入分配,背后涉及经济结构的变化,将对行业产生颠覆性的作用。

监管高度重视数字化转型 。连续三届的深交所技术大会均围绕数字化转型:2018年的“科技引领·迈向数字化新时代”,2019年的“科技引领·构建行业数字化新生态”,2020年的“科技引领·共谱数字化新篇章”,证监会副主席李超在2020年深交所技术大会上指出:近年来,证监会认真贯彻落实党中央、国务院关于建设数字中国的决策部署,扎实做好顶层设计,制定全系统数据体系建设和发展规划,优化科技监管体系,增强科技监管效能,大力建设数字化应用平台,积极开展金融科技创新试点,持续推动数字化战略有效落地。

金融经营机构数字化正当其时。 随着新一代科技革命和产业变革深入发展,数字化浪潮蓬勃兴起,数字化不仅影响了证券行业客户、市场、上下游合作伙伴等价值链要素,将重构整个行业的价值体系。以证券公司为例,券商面临的风险挑战主要包括:互联网原生企业的颠覆、国内银行与保险混业营、国外领先投行进入中国重塑了新的行业竞争格局;以个性化、定制化、场景化为特点的消费方式重塑了现有客户服务模式;信息传递方向从 PC、 移动为代表的方式向,万物互联、线上线下融合,信息精准触达的方式变化;企业内部运营管理从经验驱动向以数据感知、洞察、决策、执行闭环的智能运营的模式持续改进;员工与企业的关系从雇佣关系向员工赋能的方式变化,协同的节点从围绕企业为中心向共生、共创的协同网络的模式转变。

2 转型推动企业价值创造的转变

尽管大部分企业都知道需要数字化转型,但对于如何数字化转型,往哪些场景转型,如何转型可能会比较模糊,围绕价值创造角度是一个方法。

关于 “价值”的观点:

陈春花教授在2020年经营关键词提到:“在数字化时代,企业真实的定义是创造顾客价值,所以2020年首先的经营策略选择,应该是为顾客创新价值以驱动增长。如何真正去理解顾客价值,如何借助于技术创新,为顾客创造价值,是获得增长的根本来源。”

在《价值革命 :重构商业模式的方法论》一书中提到当前判断一个企业商业模型是否成立的核心标准在于价值创造和价值捕获这两个维度是否平衡,即你在为用户创造价值的同时,自身是否能够从中获取价值。 价值创造重点是以客户为中心为为客户创造价值,价值捕获是在价值创造的前提下企业自身能够从中获得的价值。

2019年,ITIL4 标准正式发布,重点聚焦企业 IT管理的价值。随着技术的快速发展,业务迭代加速,外部形势越来越严峻,IT组织面临越来越多的杂乱无章的工作,ITIL4 提出标准化、自动化服务价值流,释放 IT人力创造新的价值 。ITIL4 鼓励组织打破信息孤岛,强调跨组织的协作和沟通,并将敏捷和 DevOps 实践集成到框架当中,改进价值交付能力。

思考一:数字化能为企业带来什么价值呢?

在IDG对全球领先的702位IT和商业决策者调查结果,他们认为数字化转型将从企业管理、业务经营等产出价值,具体如下:

1.提升员工生产力(52%):通过移动化、数据化、在线化等工具加强协同,提高员工生产力。

2.数据驱动业务(49%):利用数据与业务模式的融合,将更好的管理业务洞察、决策、执行。

3.提升客户体验(46%):利用数据能更好的理解、洞察客户需求与客户反馈,并快速且准确的满足客户体验。

4.业务在线(46%):构建全在线的业务交付方式,落地实时在线的数据资产。

5.流程自动化(37%):通过自动化业务及运营流程,释放生产力。

6.增加收入来源(33%):围绕数据形成新的业务或产品模式,增加收入。

7.促进产品创新(31%):通过数字化将为产品的升级及创新提供新的源泉。

结合IDG调研,以及对数字化转型的理解,我总结一下数字化转型为企业带来的三个最重要的价值:

1.提升客户体验,创造客户价值 ,实时感知客户需求,快速响应客户,为客户提供个性化服务;

2.加快速业务创新,重塑商业模式,以客户为中心的价值创造与价值捕获方式重塑现有业务模式,提升业务竞争力、增加收入;

3.提升运营效能,提能增效 ,盘活公司资源配置,促进协同,激活员工参与,重塑员工生产力,建立企业内外双在线的工作模式。

思考二:传统ROI绩效指标与客户价值创造驱动的方式有何不同?

说到价值创造,还有一个词是价值捕获。以往,企业更关注价值捕获, ROI(投资回报率)是价值捕获的一个评估指标, 百度百科的定义是:通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报,它涵盖了企业的获利目标。

ROI是一个有形的,可量化的绩效指标,在一个确定性比较强的商业世界里,ROI很有指导意义,ROI是衡量一个企业盈利状况所使用的比率,是衡量一个企业经营效果和效率的一项综合性的指标。但进入数字化时代后,企业的客户、市场、供应商等价值链要素都发生了巨大变化,企业面临环境的最大特征是复杂性与不确定性。《edge价值驱动的数字化转型》中引自哥伦比亚商学院教授Rita Mcgrath的观点:“在当今快节奏、不确定的世界里,可持续竞争优势本身己经不存在,取而代之的是短暂的竞争优势,在这种竞争优势中,快速学习和高适应力是通过成功的入场券。”也就是说,Rita Mcgrath的观点快速响应能力、适应力和客户价值应该成为商业投资的驱动。

数字化时代复杂性、不确定性、非线性等特征,导致原来ROI不能作为企业最关键的驱动的绩效指标,而应该认识到企业成功的并非要考虑如何搭建商业模式,而是要看到机遇,如何满足用户需求。所谓的“机遇/需求”就是“价值”在企业实践中的具体表现形式:找到目标用户,发现他们急需解决的问题,并为用户提供解决方案,这就是价值主张。也就是说,数字化时代,企业的价值创造要以客户价值创造、快速响应与适应能力作为关键的绩效指标。

3 数智万物下,IT运维何去何从?

进入数智万物的数字世界,技术本身的追求不应该作为金融公司技术团队的价值创造,而是应该围绕在企业价值下重新思考运维价值,由新的运维价值重新设计运维的数字化世界。

数字化及数字化转型定义比较多,前期对相关定义作了一个解释:数字化转型是 以数字化思维,通过数字化技术的应用,构建一个符合企业价值创造与价值捕获的数字世界,对现有商业模式、运营方式、企业文化进行创新和重塑,实现业务价值。也就是说数字化时代,企业将围绕客户价值创造与价值捕获重塑一个数字世界,我们都将进入一个数智万物的时代。听起来有点抽象,但其实, IT运维应该对数字化并不陌生,IT 运维工作实际上是一个相对数字化的环境:

  • 运维协同网络中面临的硬件机器、软件资产、配置信息、架构、运行状态、业务运营状况等都是比较适合数字化或已经数字化;

  • 运维关键的工作流程有成熟的 ITIL、ISO20000、ISO9001、ITSS、DevOps等方法论推动线下到线上;

  • 运维的很多线下的工作在很多年以前便开始推进自动化、在线化;

  • 配置、日志、监控、流程等数据也有较成熟的技术方案实现集中的持久化。

所以,数字化转型对于运维带来的挑战不是数字化的技术表现,而是数字化转型推动新技术、新场景的快速迭代,让运维面临的复杂度、不确定性因素加大,这与传统运维对于稳定、可靠的追求相反。

那么,运维应该如何应对复杂性与不确定性?类似 OKR 的思路中目标是从企业目标不断分解,传递到组织、团队、个人,我的老板提出了一种递归的思路看待企业价值的分解与传递。他认为数字化转型实施可借鉴计算机 “递归算法”,即把整体问题分解成规模缩小的同类问题,然后逐步递归调用解决。递归算法的关键是总体目标的实现,由目标一致的细分方法不断分解来实现。他认为在数字化转型的规划阶段可采用自上而下的策略(即递推分解任务),在实施阶段则采用自下而上的策略(解决分治任务),最终由局部数字化管理的实现推动公司整体数字化转型。基于这种由企业到 IT 组织,再到运维的价值传递,下面先介绍 IT 价值。

3.1 IT 价值创造的演进

企业要实现价值创造,需要从输入客户需求开始,由业务产品或服务进行交付,实现业务价值创造与价值捕获, IT的价值则需要瞄准业务目标进行转变。结合前面提到的 “提升客户体验、加快业务创新交付、为运营提能增效”三个数字化转型价值,我们可以先看看 IT价值的变化。

传统的IT组织架构通常包括公司层面与部门层面。公司层面的分管CIO或CTO,IT治理委员会,公司级的项目办公室。部门层面则包括:IT规划管理,即根据公司战略及业务发展,设计IT体系架构和部署线路;IT研发管理,即根据现有IT系统架构和系统,受理业务功能优化需求,支持业务开展;IT运维管理,即提供基础设施环境支持,确保业务连续性、可用性、安全性,提供IT运营服务支持;IT信息安全管理,即制定信息安全制度、流程、技术管控,确保信息系统、数据安全运行;以及,其他IT测试/质量管理、IT项目管理、人员管理、外包管理等。传统的IT能力体系可以归纳为下图,在这个图中如果说应用研发、数据治理服务、质量/测试是为了活得更好 ,那么运维管理是为了能活下去 ,这点在金融行业尤为重要 。

在IT组织架构中,IT部门主要承担成本中心角色,主要以技术提供者身份出现,强调被动支持业务需求与运行保障。随着业务与科技的快速发展,IT系统环境发生了巨大变化:架构层逐渐从本地化转向云化、虚拟化,应用层的应用数量激增,迭代速度加快,业务复杂度与系统架构越来越复杂,系统间关联度高,数据量呈指数级增长等变化,而现有成本中心的工作模式将受挑战。基于此,IT部门工作方式需由被动响应方式向主动运营方式转型,将IT价值从被动支撑中逐步分离出来。首先是向强调IT主动服务能力的服务中心角色转型,目标是打造敏捷型的团队,提升IT交付效能,更好的支撑业务发展的需要。在实现服务中心后,下一步是致力于主动利用数字化技术创造新的业务机会,从IT资源中寻求更多的业务突破,引领业务创新,即由服务中心向业务创新中心转型。在实现业务创新中心的同时,近年来不少商业银行成立IT子公司,向利润输出的价值中心转型,为企业外部市场提供IT服务,为企业创造更多收入。


IT 要成为价值中心,推动业务高质量的发展,重点是让公司更好的实现 “提升客户体验、加快业务创新交付、为运营提能增效” 三个价值。转换成 IT 能力包括以下 6 个:

  • 连续性保障能力: 以数据驱动的业务连续性保障与风险防控能力;

  • 客户服务能力: 以客户为中心的“感知、决策、执行”的服务能力;

  • 快速交付能力: 利用敏捷、设计思维等方法,推动技术平台转型,快速支持业务,交付新产品、新服务的创新能力;

  • 生态扩展能力: 开放的场景接入,融入或构建生态的能力;

  • IT服务能力: 提升IT服务效能,灵活弹性、安全可靠的技术基础资源交付能力;

  • 运营协同能力:构建高效的数字化工作空间,优化资源配置,为运营提能增效。

上述6大IT能力的建设,需要从组织文化、流程机制、技术平台三个角度制定相应措施,比如在组织文化方面,在合规风控基础上推行敏捷文化,增加扁平化、柔性化、网络化的敏捷组织架构,打造快速响应能力;在流程机制方面,以数字化协同网络、数据智能、敏捷交付等数字化思维,重塑协同机制等;在技术平台方面,推动业务中台、数据中台、技术中台等共享能力中心的技术架构转型,推动大数据应用、智能应用、自动化应用、智能风控等数据应用建设,以及建立云数据中心,一体化运维平台等技术平台。

3.2 从IT能力建设驱动运维价值创造

3.2.1 运维面临的挑战与转型

传统的运维团队,通常按职能划分不同的纵向职能型团队,比如:应用/业务运维、运行操作、系统运维、网络运维、硬件资源运维、安全风险运维、服务管理几个部分,不同企业对于具体团队的职能可能有所不同或合并。进入数字化时代,IT架构面临的复杂性越来越高, 以证券行业为例,对证券实时交易而言,业务停滞一秒均可能带来巨大损失,证券自身的业务特点以及外部监管“零容忍”的要求,信息系统业务连续性的诉求远高于其他行业,确保业务连续性成为证券行业IT 运维的核心任务,业务连续性管理的总体目标是提高公司的风险防范能力、有效地减少非计划的业务中断、防范运维操作风险,对于首次出现的未知异常能够利用工具量化分析并快速定位,确保在重大灾难性事件发生后能按计划恢复业务连续性。

在这样的背景下,近年来传统的运维团队认识到采用原来被动救火式、问题驱动式、操作运维、经验运维等特点己不能有效支撑公司业务发展与转型,所以不少企业的运维提出了一些转型的思路,比如:

从被动救火式向主动精细化转型,专业化分工、标准化流程、建立横向持续优化型团队;

从问题驱动向服务驱动转型,抽象运维IT服务能力,建立IT服务目录,量化IT服务输出能力。

从操作运维向运维研发转型,为运维人员提供运维研发平台,降低运维研门槛,快速落地一些紧迫的运维工具,降低操作性、重复性的运维工作;

从依靠经验向数据驱动运维转型,结合数据分析、知识库、机器学习技术促进运维智能化。

从运维向IT运营转型,这里的IT运营通常围绕IT自身的效能提升、风险控制、降低成本角度,开展数据分析。

还有其它类似SRE、AIOps、NOOps等转型。

上述转型主要通过运维内部自发性、偏技术角度驱动,容易出现与公司价值不匹配,转型方向有误,产出不明显,投入不能持续等问题。从价值传递的角度,我觉得运维转型要从公司价值主张出发,传递到需要 IT能力,再思考需要什么运维价值 。也就是说, 围绕 “提升客户体验、加快业务创新交付、为运营提能增效”三个企业的转型价值,分析客户及业务价值主张,了解客户与业务的痛点,再从 IT团队“客户服务、连续性保障、快速交付、生态扩展、IT服务、运营协同”6大能力角度,分析运维在数字化转型过程中的关键价值。

总结起来,我觉得运维可以考虑围绕“提高业务连续保障水平”、“提升业务交付效率”、“辅助提升客户体验”、“提升IT运营服务质量”。

3.2.2 提高业务连续性保障水平

1、提升业务连续性保障水平的方法

业务连续性管理是整个运维,乃至IT最基本的工作,业务连续性问题事关 IT是否“活下去” 。在业务连续保障的思维中,可以参考架构设计中 “故障一定会发生”的思路,梳理分解影响业务连续性因素,量化这些因素的评估能力,持续完善组织能力、流程机制、应用架构与工具平台支撑。业务连续性保障是运维的重中之重。在金融行业里的业务连续性通常采用BCM(业务连续性管理),百度百科对BCM的定义:业务连续性管理( Business Continuity Management ,简称 BCM ),是一项综合管理流程,它使企业认识到潜在的危机和相关影响,制订响应、业务和连续性的恢复计划,其总体目标是为了提高企业的风险防范能力,以有效地响应非计划的业务破坏并降低不良影响。

上图是介绍BCM的一张图,从上图可以大概看到影响业务连续性的要素,每个要素的缺失都可能引发业务连续性问题,即类似木桶原理,影响要素的最短板决定整个业务连续性。进入数字化时代,政策、市场、业务模式、外部安全、系统架构、迭代效率、新技术的应用等因素进一步增加了业务连续性的不确定性。结合生产事件的工作经验再总结一下影响业务连续性的因素:变更问题、维护问题、性能容量问题、操作问题/误操作、容灾/应用架构高可用、应用逻辑缺陷、版本控制、产品或功能设计不足、数据质量、高可用有效性、应急方案、技术保障方案不完善、应急预案缺失、应急演练不到位、问题跟踪不闭环、参数设置问题、配置问题、人员技能不足、流程机制不完善、外部攻击、基础设施异常、数据备份、数据丢失、监控发现及时性、故障处置时效性等(详细可见下面的鱼骨图)。

2、如何提升业务连续性保障

以前面影响要素中的 “故障处置场景“为例,我从一个故障处理流程步骤,量化业务连续性相关指标以便我们分析如何达到”提升业务续性保障水平”:

1) 监控自动发现事件的百分比;

2) 监控发现事件的平均时间;

3) 备机接管成功次数百分比、备机接管的平均时间;

4) 应用级异常自愈自动化成功率(分为应用程序健壮性涉及的降级、熔段等,与应用程序以外的自动化自愈);

5) 业务影响分析,涉及业务中断或重要业务量损失比例;

6) 问题诊断分析及解决的平均时长;

7) 应急协同响应时长;

8) 应急恢复时效性与平均处理时长;

可以看到,第1-2针对故障发现,第3-4针对应急自动化接管成功情况下,第5-8针对接管失败或无法自动化下的应急恢复。对上面8个指标进行运营分析,可以驱动故障处置场景的连续性保障能力,具体分析后的点:如何提升监控覆盖面,如何提升监控发现事件的及时性,如何提升架构或容灾的可用性,如何提升应用架构非功能设计水平,如何快速感知业务影响,如何加快问题诊断,如何加强应急协同,如何加强应急处置的工具及技能。即,分解影响业务连续性因素节点,量化评估节点的有效性或运作质量,通过可量化指标及工作流程机制驱动组织能力、流程协同机制、工具的完善,提升业务连续性、健壮性。

随着生产环境复杂性不断增加,影响业务连续性要素越来越多,在现有人力与技术手段下,运维团队将很难有效保证业务连续性,利用新一代数字技术在复杂的IT世界中建立适应性系统是必由之路。提升业务连续性的方法有:

1) 以 “连接网络+数据驱动 ”重塑“监管控析”运维平台化能力。 “连接网络+ 数据驱动 ”不仅仅是实现运维数据“采存管算用”的技术能力,而是要以业务为中心,重新梳理与业务互联网络连接的点,围绕业务连续性价值驱动运行数据的在线落地,将上帝视角的数据分析能力融入到“监管控析”平台。

2) 以主动的运行数据分析推动应用架构的健壮性 。通过性能、容量、安全、可用性、业务感知、客户反馈等运行分析评估数据,辅助研发团队发现线上潜在问题,在异常问题爆发前优化应用,提升系统健壮性。

3) 加强应急管理、可用性管理能力,推动运维前移,加强应用架构非功能性设计 。

4) 落地敏稳双态的运维模式 。敏稳双态的运维模式将长期并存,针对不同态的应用系统建立不同的连续性保障方式,稳中求稳,敏中求快。

5) 优化协同机制 ,采用运维工作场景全在线的方式提升运维工作的工作在线、操作自动化、可视可控。

6) 持续推进运维组织人员能力建设,建立学习型组织 ,推动可用性、稳定性为目标的 SRE 模式。

7) 云化基础设施 ,提升基础设施的稳定性、高可用、安全性、弹性伸缩能力。

8) 建立混沌工程 ,主动检测、演练、发现、修复影响业务连续性因素的风险。

9) 加强数据应用 ,健全应对新技术风险的信息安全防控体系。

3.2.3 提升业务交付效率

1、提升业务交付效率方法

如果说数字化转型中业务转型的关键是以客户为中心,那么技术转型关键是快速交付、快速适应。

提升业务交付效率应以IT关键价值链作为切入点。我们知道软件生命周期(SDLC)主要包括:构思、论证、需求分析、方案设计、开发、系统测试、用户验收、部署发布、生产维护、后评价、退出,这个过程形成了全生命周期的IT风险管理。对SDLC进行分析,可以考虑分解以下三条价值链路:

1)IT需求交付价值链(项目、需求、设计、研发、测试、发布)

2)IT服务交付价值链(SLI、SLO、SLA、服务目录、服务请求、服务响应、服务反馈)

3)IT系统退出(投入收益指标化、运营、评估效能、启动退出、释放资源)

可以考虑从以下几个角度切入来提升交付效率:

1) 从业务需求及产品设计角度,更快的感知客户需求,准确挖掘痛点,利用设计思维及MVP等思路引导业务构思,建立敏捷型的产品研发模式,加快业务交付效率。

2) 运用更灵活的中台架构,比如中台架构的可复用、可共享、组件服务化,沉淀业务逻辑及技术标准,加快前台应用的敏捷。

3) 推进更先进的应用架构,比如云原生方法论,包括容器化、微服务等,全面向云化的技术架构转型。

4) DevOps的持续交付能力建设,推动全链路的持续集成,持续发布工具链及协同模式建设。

5) 利用混合云的基础设施,发挥云计算弹性、灵活、自动化等特征,屏蔽基础设施的复杂性。

6) 建立数字化的系统投入与收益评估模型,推动系统退出机制,释放资源投入到业务需求。

从上面几点,我觉得运维可以重点围绕:利用运行数据运营分析辅助业务决策(第1点)、推进持续交付中的持续发布能力建设(第4点)、云化基础设施(第5点)、建立系统退出机制(第6点)。

2、运维如何提升业务交付效率?

利用运行数据运营分析辅助业务决策。相比于产品、需求、研发、测试等 IT岗位,金融企业的运维岗位是一个复杂的、综合性技能的工作岗位,需要掌握大量的方法论与技术栈。也正是因为运维岗位的综合性,运维应该结合运维对应用系统逻辑、链路等架构,以及己掌握的运行状态与业务感知数据,为业务感知、业务运营、业务创新等提供决策支持。具体的包括:利用线上化及自动化工具平台支撑,将运维从操作性、重复性的工作中释放出来;利用运维数据分析、数据可视化等,为业务提供应用运营效能、业务状态感知,辅助业务决策信息;利用运维工具,比如监管拨测、性能管理等工具,辅助业务更快的感知新业务上线后的运营状况。举个例子,为了快速将新产品或需求上线,系统可能会减少相关运营类数据分析工作,如果运维快速提供相关新产品或需求的实时运营状况,就能帮助业务更快的感知新业务落地情况,适时调整运营方式。

推进持续交付中的持续发布能力建设。市场的高速变化,需要业务保持敏捷的适应能力,快速抓住商业机会,快速迭代业务需求,不断试错。对技术来说, IT需要拥有持续交付的能力,包括需求、研发、测试、运维的交付过程 。金融企业研发、测试、开发在组织层面进行分离,结合康威定律,比较好的持续交付落地方式应该是多个团队共同参与CI与CD的建设。运维侧可以牵头CD侧的平台落地工作,通常让整个发布部署流水线在线化,可以让软件测试、部署、发布更加快速,并通过在线化让发布过程人人可见,更早的发现并解决问题,在线的进行部署版本管理。另外,对于敏捷型的发布模式,AB测试、灰度也是实现软件持续交付的方式。

云化基础设施。云计算将传统硬件、系统软件等复杂的基础设施资源进行整合和自动化,过滤技术细节,为上层面的应用场景提供简单、按需、所见即所得的基础设施服务,极大的提升研发工作效率、减少重复建设、提升资源利用率,且平台对资源需求的弹性支撑有助于保障应用系统更有效的应对市场行情的波动。证券公司的云平台通常采用混合云模式,可以考虑以私有云建立完整的 IAAS和PAAS,并根据业务需要引入行业云、公有云,其中涉及敏感数据的应用系统部署于私有云,非敏感信息部署于行业云或公有云。

建立系统退出机制。随着企业 IT建设不断建设,只上不下的模式将大大占用IT资源,系统数量的不断增加需要配套投入更多的人力、硬件、正版化软件、网络带宽、基础设备等资源。按国家计算机相关认证考试评估,软件上线后的IT运行管理阶段是SDLC(软件全生命周期)中持续时间最长,投入最大的阶段,约占60%-80%。以数据驱动的方式加强IT运营管理将有助于提高应用系统运营效能,通过定期识别并释放低效能业务系统资源,将有效IT资源倾斜到高效能的应用系统,以此来提升IT交付业务的效率。

3.2.4辅助提升客户体验

以客户为中心,提升客户体验己作为大部分公司转型的关键战略目标。

百度百科对客户体验作了一个定义:“是一种纯主观的在用户使用产品过程中建立起来的感受”。从企业角度看客户体验,需要建立客户体验管理,建立客户与企业接触的全触点的用户旅程,包括感知、搜索、推送、使用、倾听、反馈等,以持续提升产品、营销、服务的系统性工程。Gartner对客户体验管理作了如下定义:“设计和响应客户互动以满足或超越客户期望的做法,从而提高客户满意度,忠诚度和倡导度。”

1、客户体验管理方法

主动优化客户体验,关键是构建与用户的各种连接,采用与用户相关度更强的思维方式,做出可执行的业务策略组合,在实施上可以从用户故事分析、客户感知、客户沟通、产品交互、产品设计五方面开展。用户故事分析,即按客户与我司业务的接触点,对现有产品或服务整个生命周期进行分解,对每个接触环节的客户操作友好性进行针对性优化;客户感知,即加强感知客户体验数据的获取,包括业务应用中客户端数据埋点、一线员工反馈、对关联客户行为分析、外部舆论等,利用数据处理技术深入洞察,探寻用户显性与隐性需求;客户沟通,即与客户建立友好的客户沟通闭环,为客户提供方便的沟通渠道,为一线业务提供更全面数据支撑,加强应对客户反馈的在线实时性;产品交互,即结合社交、视频、物联网新一代产品交互方式,用户可以通过自然语言、沉浸智能等产品交互方式获得业务服务,激发客户积极性与深度参与;产品设计,培养产品经理的设计思维,加强业务与技术的深度融合。

CRM,即客户关系管理,百度百科字义为:“ 企业 为提高核心竞争力,利用相应的信息技术以及 互联网技术 协调企业与顾客间在 销售 、 营销 和服务上的交互,从而提升其 管理方式 ,向客户提供创新式的个性化的客户交互和服务的过程”。CRM重点是从企业出发,改善用户关系,给企业带来利润。从价值角度看,CRM关注价值捕获,但进入数字化转型时代,强调客户价值创造,要明确客户价值主张,解决客户痛点,实现客户价值,在这样的基础上企业的价值捕获自然会得到。

数字化转型下的客户体验管理需要从客户角度出发,关注客户的感觉、情感,所以下面引出CEM的方法。CEM是客户体验管理的一个方法论,管理客户对产品或公司全面体验的过程,在IBM、奔驰、DELL等国外企业得到应用。CEM以提高客户整体体验为出发点,注重与客户的每一次接触,通过协调整合售前、售中和售后等各个阶段,各种客户接触点,或接触渠道,有目的地,无缝隙地为客户传递目标信息,创造匹配品牌承诺的正面感觉,以实现良性互动,进而创造差异 化的客户体验,实现客户的忠诚,强化感知价值,从而增加企业收入与资产价值。通过对客户体验加以有效把握和管理,可以提高客户对公司的满意度和忠诚度,并最终提升公司价值。

CEM核心理念主要包括3部分:Listen(倾听反馈),Analyze(挖掘价值),Action(行动指引)。具体的,Listen重点是指收集线上公开数据与打通个业内部数据,打破信息孤岛,关注数据采集、客户感知等;Analyze重点是对在线数据进行分析,实时分析挖掘,洞察客户观点与需求,竞品信息、市场信息等,关注数据分析能力;Action重点是通过数据洞察,辅助管理或产品设计者决策,并推动一线业务的客户服务决策,关注自动化决策、主动客户服务等。

2、运维应该如何提升客户体验?

结合上面提到的从“Listen,Analyze,Action”三个角度,我们看看运维能做些什么。

增加客户行为数据的收集与分析,为产品设计的决策提供辅助数据 。数据资产将成为公司核心竞争力,业务在线通常是数字化资产化的第一步。全方位的在线数据通常包括:员工行为数据、客户行为数据、竞争环境、业务经营数据、业务 / 运营管理数据 5类。员工行为数据主要包括员工团队协作、工作执行、完成质量、意见反馈等数据;客户行为数据是客户体验优化的前提,主 要包括客户行为,包括客户的个性化喜好,客户对企业数字产品的反馈等;商业环境数据包括客户群、竞争对手、合作伙伴、监管的变化,以及合作伙伴活动、竞争对手举措、行业趋势、监管政策、宏观经济等;经营数据是数字化转型绩效指标。提升客户体验,运维侧重点要关注客户行为、业务 / 运营管理数据。运维涉及大量的应用日志、性能管理、网络报文、功能监控、业务拨测、各类 SLI等 数据,这些数据以往主要用于运维业务连续性保障方面的实时监控、性能分析等用途,对于业务数据分析来说可以说是一个未开采的宝藏。以网络报文为例,以往应用系统通常将交易的结果持久化,网络报文一方面能补充交易节点之间的通讯过程数据,形成端到端的数据连接,另一方面这类数据通过 NPM等 技术能实现低延时的持久化与分析能力,对于提升客户体验来说是一个很好的数据资产。同时,应用日志,以及监控数据等数据,在客户体验分析方面也有独特的作用,这些数据都可以作为企业数据资产的补充。

加强业务系统的性能管理,优化响应效率。 雷军也说:抛开性能谈体验全部是耍流氓。谷歌有一个关于网页响应时间最大值 1秒的观点,他们作了一个调查研究,发现如果移动网页加载时间超过1秒,用户就不愿停留在页面上。同样的例子,网络延迟每增加0.4秒,亚马逊每年损失16亿美金,而每减少0.4秒,雅虎访问量就会增加9%。由于当前系统架构越来越复杂,对用户体验的提升已不仅仅需要提升单一应用的反应速度,而是要跟不同的应用串联起来,整合成让用户真正接受的内容。数字化转型对于运维的要求己不仅限于业务不断,还要求运维能够在用户发现问题前更早的发现并解决问题。所以,运维需要在现有的以业务连续性为基础的监控体系中,加强业务性能管理能力,收集更多的应用响应、时延、交易失败等数据,了解用户在使用应用过程中的问题、等待时长,在最短的时间内解决问题。

模拟客户行为操作监控,提前发现并解决潜在问题。主动拨测是一种主动性的监控测试方式,主要利用跨区域的监控网络,以真实终端用户使用场景为视角,对目标应用进行性能管理和网络性能监控,透视防火墙外的各环节性能,先于最终用户挖掘故障隐患。拨测通常是模拟用户访问域名、 URL、API等方式,检测网络链路质量,监控web的事务可用性,主动感知用户端应用访问体验,先于客户发现问题。在拨测的方向看,通常可以拨测监控不同区域的运营商的性能耗时与丢包,拨测网页元素与可用性指标,拨测竞品对比监控,终端类型的运行时长,区域性能数据等。拨测相比传统监控手段,能够更好的从功能层面提前发现问题。

建立混沌工程思想,对应用系统进行主动的破坏性测试。进行数字时代,运维面临的环境越来越复杂,比如全新的应用集成与发布模式,渠道设备的数量与各类快速扩大并在线互联,各种基础设施及新技术的应用,大规模的分布式、云原生应用引入等。混沌工程起源于奈飞的 Chaos Monkey项目,这个项目主动进行破坏性动作以验证、发现、提升系统健壮性、应急处理等能力。混沌工程遵循的原则是:避免大多数失效的主要方式就是经常失效。混沌工程是一种帮助我们获得更多的关于系统的新认知的实验方法,随着混沌工程应用的不断深入,涉及的破坏性测试己经从原来的基础设施层面的可用性测试,向应用功能、上下游链路等功能性、业务冗余等方面测试。混沌工程是以数字化时代复杂性下的一个适应性解决方案,深入使用将有助于提升客户体验。

3.2.5提升IT服务质量

1、 提升 IT服务质量的方法

提升IT服务质量要先看看IT部门被抱怨比较多问题:业务系统连续性问题、业务需求交付速度、服务期望与实际交付效果差距的问题。数字化转型推动IT支持能力全面软件化,企业对IT的期望从确保系统连续性转向提升应用效能,促使IT为业务及运营提供更好的支持。IT服务(ITSM)呼应这一业务期望,百度百科对IT服务管理的定义:是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法。IT服务管理核心思想是IT组织主要工作是提供IT服务,IT服务质量由用户判断,通常会结合SLA来保证IT服务交付的协同流程,重点是面向客户或业务。大部分企业将ITIL作为ITSM的指导思路,并形成一个信息化的IT服务管理系统。ITIL一共有5个版本,分别是:ITIL V1,ITILV2,ITIL V3,ITIL 2011,ITIL4。大体看,V2以前主要提倡流程管理的思路,V3以后则强调IT服务,服务则涉及服务战略、服务设计、服务转换、服务运营、持续的服务改进。最新的ITIL4,在原来的版本上整合了一些敏捷、DevOps、精益、IT治理、领导力等工作方法,将IT组织内的运维、研发、测试与IT组织外的业务、客户的协同整合到了一个整体的方法,提供一个数字服务的管理模式。将ITSM向企业扩展,就形成了ESM(企业服务管理),即将企业内标准化能力服务化,提供相应协同输出的服务能力。

除了ITSM以外,BSM也是提升IT服务的方法,百度百科的定义是:以业务为重点的 IT服务 与基础IT基础设施之间建立起联系的软件。以业务为重点的IT服务可以是特殊的IT服务或者是业务流程的一部分,它需要实现 IT 资产与其支持的业务服务之间的动态映射,支持业务 所有者 重要的、可见的业务指标。有些解决方案中,将IT服务分为三个阶段:主动管理阶段,此阶段对关键环节流程化,提供的服务是业务连续性保障,IT资源的有效管控,重点是提高IT环境的运行质量;第二阶段是服务管理阶段,此阶段以ITSM为方法,以服务、流程为导向,以客户为中心的管理方法,通过集成IT服务和业务,协助企业提高其IT服务提供和支持能力;第三阶段是业务价值阶段,采用BSM实现管理提升在信息时代,企业的发展和IT环境的成熟是一个互相驱动、交替上升的过程。这个过程与前面分析的IT转型方向相匹配。

2、 运维如何提升 IT服务质量?

提升IT服务质量通常有三个环节:建立评价IT服务质量的管理模型,建立全在线的IT服务交付模式,搭建IT服务管理系统。以下从这三个角度介绍:

建立评价 IT服务质量的管理模型。要建立评价 IT 服务质量的管理模型,首先要从思维上由传统注重内部动作转向面向对外服务输出的转变;其次要深入了解业务部门对 IT 服务的需求,并将业务需求转化为 IT 服务的核心目标;接下来是将 IT 需求转化为线上支持服务,并建立一套完整的、可评估的 IT 服务评价协议, IT 服务评价协议由可量化的指标组成,评价指标不仅包括 IT 部门,也包括业务部门、外部供应商,用于 IT 服务水平的评估与持续改进。在实施上,通常采用 SLA 、 SLO 、 SLI 进行逐层分解,其中 SLA(Service Level Agreement):服务水平协议,是IT服务提供方和被服务方之间就服务提供中关键的服务目标及双方的责任等有关细节问题而约定的协议;SLO(Service Level Objective):服务质量目标,服务提供方与服务需求方对服务期望,比如系统可用性是4个9,还是3个9;SLI(Services Level Indicator):服务质量指标,SLO需要通过一系列SLI技术指标指标细化并量化,比如上面的可用性可能会转化为运行时长,故障时间等,性能的话会转换为响应时长、成功率等。加强 运维组织的 IT服务管理, 可以采用 SLA为基础,以SLO为服务质量期望,以SLI为量化指标 ,来设计自身的服务流程、提供服务形式、绩效评估方法。

建立全在线的IT服务交付模式。建立全在线的 IT 服务交付模式可以考虑采用以下方式:首先,对关键的 IT 支持服务以流程方式落地,可以借鉴 ITIL 的服务提供流程和服务支持流程,其中服务提供流程包括服务级别管理、财务管理、容量管理、 IT 服务持续管理、可用性管理等,服务支持流程包括配置管理、事件管理、问题管理、变更管理、发布管理等;其次,随着 IT 成为日用品,企业对 IT 需求越来越多,传统的支持服务流程将无法满足业务需求, IT 需要具备快速服务化 IT 支持能力,推动 XAAS (一切皆服务);同时,服务化 IT 支持后,还需要线上系统支持服务的交付,交付模式即将人(服务需求方、服务供应方)、事、系统利用线上方法连接起来;最后,全在线的 IT 服务交付模式沉淀了数据,需要利用数据运营来推动服务交付质量的持续提升。

搭建IT服务管理系统 。IT 服务管理系统通常的组成部分包括:服务台、故障及变更等关键流程、配置管理、服务目录、知识管理等,其价值主要有:

  • 确保IT流程能够支持业务流程,提高业务运营质量。

  • 通过核心的流程的保障能力,为业务提供可靠的业务支持。

  • 将IT服务以SLA约定,让业务对IT服务质量有明确的期望,并清楚需要的付出。

  • 标准化并线上化IT服务,加强IT与业务的协同,让IT更好的服务于业务。

  • 全在线IT服务获取与交付,提升客户/业务满意度。

这里,推荐企业建立统一的IT服务目录。在IT组织内部将IT能力标准化,形成服务目录,企业中用户能够像进入电商系统上,找到自己所需要IT支持的服务,并申请服务,同时用户能够在线获得服务的反馈,并利用社交化的手段对服务水平进行评价推动IT服务质量的持续提升。这里的IT服务目录是将IT所有内部、外部服务加以整合、标准化,为服务供需双方提供线上连接的工具,并与服务台、知识库、自动化、云平台等连通,提供人工、半自动化、全自动化多样的能力。服务目录主要为了应对以下问题:

  • 业务不知道IT能够提供什么服务,有些业务认为和“电”相关的都和IT有关,有些认为只有软件开发才与IT有关。

  • 业务、IT对于IT服务的定义或期望不匹配,是否所有系统的可用性都应该是4个9,所有IT需求都应该是一周内迭代上线?

  • IT作为成本中心,源源不断的消耗公司资源,IT价值是好是坏如何衡量?IT服务是否有成本?有限的成本应该往哪个方面倾斜?

  • 以成为中心为基础的IT组织充当被动的角色,缺少可量化的服务质量水平与清晰的计划,主动的持续优化服务质量

  • IT服务的支持以经验导向为主,IT组织缺乏一个有效的、便捷的、一站式的服务协同工具,IT可以快速上架服务,业务可以透明的获知服务反馈,管理上可以基于服务交付数据进行持续优化。

  • IT组织内团队如何保持激励机制,需要提供工作机制推动IT组织内由被动向主动转型,提升IT价值。

  • IT组织关键的价值链是什么?每条价值链路实际运营情况如何?如何持续提升?

  • ……

4 总结

1、数字化转型时代己至,大部分企业都在尝试转型。

2、数字化转型三个关键价值是:“提升客户体验,创造客户价值”、“加快速业务创新,重塑商业模式”,“提升运营效能,提能增效”。

3、以客户价值创造为中心,打造企业快速适应复杂性与不确定性通常是数字化转型的一个方法。

4 、 数字化转型的规划阶段可采用自上而下的策略(即递推分解任务),在实施阶段则采用自下而上的策略(解决分治任务),最终由局部数字化管理的实现推动公司整体数字化转型。

5 、从价值传递看,可以围绕 “提升客户体验、加快业务创新交付、为运营提能增效”三个企业的转型价值,分析客户及业务价值主张,了解客户与业务的痛点,再从 IT团队“客户服务、连续性保障、快速交付、生态扩展、IT服务、运营协同”6大能力角度,分析运维在数字化转型过程中的关键价值 :“提高业务连续保障水平”、“提升业务交付效率”、“辅助提升客户体验”、“提升IT运营服务质量”。


0
相关文章