技术开发 频道

全方位剖析数据治理的四个核心流程

        【IT168 技术】数据治理构架层面的人员致力于技能和责任,而组织协调层面则侧重于各级部门之间的工作关系。在开始数据治理之旅时,很多企业在企业现有构架内实现决策责任、资源分配和职责分配,当然,早期的商业价值和企业动力都以这样的方式传递。但是,要真正把数据治理看作一个整体,努力为跨企业的多个部门带来利益时, 目前你的组织结构势必要去适应它。

机构关注的数据治理问题

  在定义一个理想的组织结构,以支持您的数据治理目标时,需要解决的问题包括:

  谁将成为执行发起人?非常好的的执行人将是非常资深的CXO级别的高管层,他们的职责跨职能、业务、应用和区域筒仓(指区域办事处或国际化经营而出现的各国代表处)。

  需要建立一个执行筹划指导委员会吗?对于任何一个拥有几千名以上员工或者超过10亿美元收入的企业来讲,这是非常普遍的,并且也是最好的方法,组成一个执行筹划指导委员会或者理事会,以支持和推动跨职能的决策、确定优先次序、资源和变更管理。这个执行筹划指导委员会当然要包括执行发起人、相关的业务和IT领导层,以及数据治理项目的管理者,他们将帮助企业确定可操作的议程安排——一般需要在每个月、每两个月或者每季度举办一次会议。

  谁是业务数据的持有者?每条业务线、每个职能小组、每个地区都有不同的优先权,业务流程、决策、相互合作尤为关键,从而支持他们的关键性能指标(KPIs),以实现KPIs为目标的业务管理者,必须接受角色问责来确保数据支持能够满足需求。

  什么是政策和数据冲突的升级路径?谁将会是参与者,以缓和异常的数据质量或安全原则、相关规则以及标准?举例而言,如果你为客户确定了数据获取原则,则需要含有完整姓名、地址、电话或电子邮件以联系客户。当你收购了一家公司,并试图整合客户数据库中大量丢失的信息时会发生什么?谁来决定该去做什么? 过程又是怎样的?

  数据管理员是全职还是兼职?找到一个合适的数据管理员是大多数公司面临的挑战。最好的数据管理员应该是跨业务和IT的优异行业专家,但是,如果他们已经声名在外,业界对他们的需求会很旺盛,他们可为你工作的时间则会捉襟见肘。所以你会恳求他们去做一个兼职的数据管理员,或者你去聘请一个可以奉献更多时间,但缺乏专业技能的人去做一个全职的数据管理员?这里没有一个正确的答案,但是综合以上的方法,或许会是一个好的战略考量。

  数据管理员与执行发起人是直线还是虚线汇报关系?数据管理员直接汇报给执行发起人是不可能的,但是如果他们在一个组织之内呢?除非你打算集中管理你的数据管理工作,许多相关领域专家在组织内按现有业务线、业务职能和地区汇报则是可能的,他们拥有专业知识,与执行发起人和/或数据治理管理者之间也会拥有虚线/虚拟的员工关系。

机构关注的数据治理问题

  我强烈建议数据治理管理者利用一个类似RACI或DACI的职责分派矩阵(responsibility assignment matrix),以帮助多方参与者协调并设置一个期望值,这些参与者涉及到数据治理的所有方面 (RACI定义了责任、解释说明、咨询以及了解项目相关进展信息的角色。DACI则提供了类似的框架,并定义了管理者、审批者、提供者、以及了解项目相关进展信息的角色。)。

  数据治理流程

  要真正把数据作为企业有价值的资产来管理,就必须像管理财务、人力资源等业务功能一样进行数据治理。财务功能由多个核心业务流程组成,如应付账款、应收账款、工资和财务计划等。那么,要把数据治理当作业务功能来管理,数据治理的核心业务流程有哪些呢?

  我用以下图表说明数据治理和管理工作的主要业务流程,当然包括预期的数据清洗、修复、屏蔽、保护、协调、升级以及审定数据差异、政策和标准这些流程。二十多个不同的流程可分为四个核心流程阶段——这些流程均可重复执行,并且根据数据治理成熟阶段的不同,可能包含一些并行的活动。

数据治理流程

  · 发现流程获取组织数据生命周期的当前状态、相关业务流程、组织及技术支持能力,以及数据本身的状态。利用从这些步骤中得到的启示,定义数据治理策略、优先级、业务实例、政策、标准、架构以及最终的未来愿景。此流程以“探索驱动定义”的形式与定义流程阶段迭代并行,同时,定义流程使发现流程更有重点和针对性。

  · 定义流程记录数据定义、与业务术语相关的业务背景、分类、关系以及实施数据治理工作必须定义的政策、规则、标准、流程以及考量策略。如上所述,此流程与探索流程阶段迭代并行。

  · 应用流程的目标是执行数据治理,并确保数据治理与发现和定义流程阶段获取的所有数据治理政策、业务规则、管理流程、工作流程、跨职能角色及职责相符。

  · 衡量和监测流程 1)获取并衡量数据治理和管理工作的有效性及价值;2)监测是否与定义的政策和规则相符,有无异常;3)使数据资产及其生命周期透明并可审核。

  数据治理提案必须构建能力、指派角色及职责并对技术进行投资,以使这些核心流程无论业务目标的范围和规模多大都能执行。以改进数据项(比如电话号码)质量或安全性的实验性数据治理项目,必须按照管理全部重要业务数据资产的全面数据治理功能的方法来执行。工作量、时间、资源以及有效实现业务价值所需的技术当然有所不同。为单一业务单元执行的单个应用程序中,对“电话号码”的验证、清洗、改进及质量监测——虽不能说微不足道——但与管理全球企业成百上千甚至更多重要的数据实体相比,明显轻松得多。

  数据治理发现流程评估和审视环境

  发现流程获取组织数据生命周期的当前状态、相关业务流程、组织及技术支持能力,以及数据本身的状态。充分利用从这些步骤得到的启示,定义数据治理策略、优先级、业务实例、政策、标准以及最终的未来愿景。此流程以“发现驱动定义”的形式与定义流程阶段迭代并行,同时,定义流程使发现流程更有重点和针对性。

数据治理发现流程评估和审视环境 

  构成发现阶段最重要的流程包括:

  数据发现。包括自动和手动工作——通常由支持技术引导和启动——发现、记录、评估所有涉及到数据的相关来源、目标及技术设施中的有关数据、元数据、域、业务规则和其它对象。

  · 发现遍布各处的数据实体,识别风险暴露的领域,寻找改进或减少数据质量问题根本原因的时机。

  · 在所有的数据源中识别出显现数据异常或业务场景的位置。许多数据探索的目的在于找出“什么数据与此分析或业务决策相关?”

  数据剖析。此流程评估目标数据集以确定当前状态,是定义规则和政策的基础。

  · 数据剖析帮助回答以下问题:“今天我们的数据是个什么样子”,“一个系统的数据如何与其他系统的数据关联”,“为改进功能,我们应该考虑定义哪些规则和政策”。

  · 如果不能理解数据的当前状态,就不能有效定义和执行重要数据质量、安全、归档、屏蔽及其他类型的政策或业务规则。

  建立数据清单。此流程识别和记录在使用、应用程序、所有权和关系的上下文环境中相关主数据、交易数据、参考数据域和属性的清单。虽然数据清单也可独立进行维护,但它一般是数据建模应用的副产品。

  · 提供所有相关数据及属性的统一视图,以考虑何时定义数据模型、规则、政策、关系、类别及其它与数据有关的工作。

  建立流程清单。此流程识别和记录组织运作的业务流程清单。流程清单通常在多个层次上进行维护,像“订单到现金”或“采购到支付”这样的主流程在顶层维护,而较为精细的流程步骤(如“创建账户”,“执行订单”)则在底层定义。

  · 数据治理和支持技术投资(数据集成、数据质量、主数据管理、信息生命周期管理、商业智能、数据仓库、)改进和优化关键业务流程、决策以及交互。如果离开业务运行流程环境和流程使用的数据,数据治理优化将没有价值。

  CRUD分析。当前状态“创建、读取、更新、删除(CRUD)”分析将业务流程、支持应用程序和系统映射为数据,从而使重要数据的生命周期可见,并易于理解。

  · 改进关键数据的可信任度及安全性时,行为、系统以及政策方面需要发生一些变化,要识别这些变化,就必须了解能对这些关键数据进行创建、读取、更新或删除/清理/归档的当前状态流程、应用程序以及相关人员。

  能力评估。组织能力数据治理当前状态评估取决于多个方面,包括技术/架构,功能性,人员技能,以及流程/政策。

  · 此流程使数据治理执行人员明悉:可以充分利用哪些组织优点,可以在哪些组织弱点上加大投入以减少风险并提高数据治理工作的投资回报率。

  数据治理定义流程正确记录业务政策,规则和标准

  定义流程记录数据定义、与业务术语相关的业务背景、分类、关系以及实施数据治理工作必须定义的政策、规则、标准、流程和衡量策略。此流程以“发现驱动定义”的形式与发现流程阶段迭代并行,同时,定义流程使发现流程更有重点和针对性。

数据治理定义流程正确记录业务政策

  构成定义阶段最重要的流程包括:

  创建业务词汇表。此流程为获取和共享与重要数据有关的业务环境上下文的协作流程。除了预期的核心数据实体和属性定义外,上下文还包括规则、政策、参考数据、任意形式的注解、链接以及数据所有者,在此就不一一列举了。

  · 确保所有人达成共识——数据架构师、建模人员、开发人员、管理员及数据使用者:业务流程所有者以及运营和战略决策者。

  数据分类。对于结构化数据来说,此流程通常被称为元数据管理——获取以元数据形式表示的相关支持业务和IT环境上下文。对于非结构化数据来说,在正确分析上下文环境,给内容做标记和归类以进行相关查询中,数据分类起到了非常重要的作用。

  · 有效的数据分类使业务用户了解环境上下文,快速跟踪信息,从而迅速应对规章遵从的需求,降低成本,提高效率,进一步了解业务和客户。通过降低集成复杂度、提高黑盒/自定义编码的透明度,可信数据分类使IT从中受益,并最终提高协作性、灵活性,缩短实现价值的时间。

  数据关系定义。此流程在元数据(数据建模)和数据(业务层次结构)两个级别定义数据关系、映射及层次结构。

  · 没有关系的数据模型只不过是一张数据清单。定义主数据、交易数据和参考数据——以及依赖这些数据的应用程序和流程——之间预期的关系,并最终定义组织业务模型。数据层次结构(例如,组织结构、物料清单、客户、产品、销售、营销渠道)是组织制定计划,决策以及客户关系的基础。

  参考数据管理。此流程定义和规范应用程序中或应用程序之间要使用的参考数据,以确保数据在获取及使用中的一致性。参考数据可以包括内部管理属性业务定义值表(如客户类型,产品颜色)、行业标准值(如ISO3166国家标准代码)、或行业规范标准(如GS1 GDSN数据同步代码表)。

  · 通用、标准化的参考数据确保能够进行数据的协调和汇总,并能从截然不同的应用程序、功能、地区或各代表处的共享数据中,或B2B贸易伙伴的共享数据中得到洞察力。

  业务规则定义。此流程创建和记录建立数据验证、清洗、丰富、匹配、合并、屏蔽、归档、标准化等规则和政策的逻辑业务需求。这些规则既定义了机器支持的自动化流程,也定义了以人为中心的手动流程。

  · 当进行到实施流程阶段时,业务规则是确保数据可信、安全并最终适合业务使用的关键。

  数据治理政策定义。此流程定义数据治理驱动政策,如数据责任和所有权,组织角色及职责,数据获取和验证标准,数据访问和使用,以及数据的屏蔽、归档、建立子集和保留。

  · 正确的定义、核准、宣传以及执行这些政策,就能将企业文化发展为把数据当作公司资产来管理的文化。如果没有这些自上而下、公司高层驱动的政策命令,将很难改变以往影响数据质量和安全性的行为。

  其他相关政策调整。组织内有些其他工作可能已经体现了业务驱动或IT驱动的政策,设置如何管理和使用企业数据,只是目前还未被列为“数据治理”政策。其中包括信息安全、数据隐私、GRC、IT管理等方面的政策。

  · 如果一项数据治理工作是要准备研究和定义必须记录和执行的政策,那么这项工作可从已经完成的工作开始,调整哪些政策应归入数据治理工作,哪些政策只需认可和遵从,而哪些应该被替换或改进。

  关键绩效指标(KPI)定义。此流程定义那些用于说明数据治理工作有效性和价值的方法,如服务水平协议(SLAs),数据质量及政策遵从操作基线衡量标准,投资回报率(ROI)和总体拥有成本(TCO)等等。

  · 如果没有衡量数据治理工作价值和有效性的方法,数据治理工作将不会获得赞助、资源、资金或优先权。

  数据治理应用流程人机共同运转

  应用流程的目标是执行数据治理,并确保数据治理与发现和定义流程阶段获取的所有数据治理政策、业务规则、管理流程、工作流程、跨职能角色及职责相符。

数据治理应用流程人机共同运转

  构成应用阶段最重要的流程包括:

  自动规则的执行。此流程在自动化系统、流程和规则引擎中执行定义流程阶段获取的数据质量、数据隐私及其它业务规则和政策。

  · 这些规则——一旦执行——是确保数据可信、安全并最终适合业务使用的关键。

  人工规则的应用。此流程在以人为中心的工作流程和业务流程中执行定义流程阶段获取的数据质量、数据隐私及其它业务规则和政策,以控制异常,制定决策。制定决策必须胸有成竹,而这是自动规则所不能或不一定能保证的。

  · 数据异常会对业务流程的有效性、劳动力的生产效率、决策的质量以及客户的满意度产生负面影响,而这些规则——一旦执行——就是把这种风险降到最低的最优方法。

  端到端工作流程的运用。应用和维护工作流程设计以支持数据治理的四个阶段和管理工作流程。这些工作流程包括所有相关系统->系统,人员->系统,人员->人员的数据治理及特定管理工作之间的交互。

  · 为实现真正全面的数据治理,业务和IT人员需要进行必要的交接与协作,这些通过工作流程来实现。

  业务/IT协作实施。实现并促进业务和IT角色间的协作,包括业务->业务,业务->IT,IT->IT的工作关系。

  · 有效的数据治理要求整个组织的多种角色彼此协调、有条不紊。充分利用协作和支持技术可以很好的促成这一目标的实现。

  数据治理衡量和监测流程:了解数据及其价值

  衡量和监测流程1)获取和衡量数据治理和管理工作的有效性及价值;2)监测是否与定义的政策和规则相符,有无异常;3)使数据资产及其生命周期透明并可审核。

数据治理衡量和监测流程:数据及其价值

  组成衡量和监测阶段的最重要的流程包括:

  主动监测。为更加迅速的识别和减少使流程发生故障的危急问题以避免重大损失,对数据质量进行主动监视,并在交易和互动操作中,实施识别、主动监测违反政策和规则的异常情况。

  · 业务和IT管理员都有责任确保数据治理遵从数据政策、规则和标准,并在必要时缓解和协调数据质量、数据隐私或数据安全的问题。主动监测和被动监测功能提供可见性,这在管理员观察和处理任何问题时都是必须的。

  数据沿袭分析。在数据的整个生命周期中执行根源分析、影响分析以及数据沿袭分析。

  · 使最关键数据的支持元数据透明可见的功能,以及协调功能是数据管理参考体系的基础要素。数据沿袭可视化及审核使数据架构师和管理员能有效评估数据定义、规则和模式潜在变化的影响——数据质量和数据安全出现问题时,进行根源分析的作用亦是如此。此功能提供透明性,以支持许多监管法令审核的需求。

  被动操作DQ(数据质量)审核。为数据管理员提供可见性,以解决数据质量相关问题,这些问题是经由实施流程阶段执行的预定义管理工作流程传递给数据管理员。

  · 业务和IT管理员都有责任确保数据治理遵从数据政策、规则和标准,并在必要时缓解和协调数据质量、数据隐私或数据安全的问题。主动监测和被动监测功能提供可见性,这在管理员研究和处理任何问题时都是必须的。

  仪表板监测/审核。数据监测起到早期报警系统的作用,在数据质量、安全、保密、依从性问题对相关应用程序、报告及流程造成严重破坏之前进行捕获。数据监测结合使用设备报告数据质量或数据安全问题的状态,确保发生变化时根据需要及时应对,进行适当的抑制和平衡。

  · 操作衡量标准的指标包括数据准确性、完整性、整体性、唯一性、一致性和标准化,以及审核确保遵从保密和安全政策。

  项目绩效。衡量数据治理工作本身的绩效。例如,衡量业务范围、功能领域、系统领域、项目团队以及组织内提供管理资源和赞助的其他部分。另外,衡量对数据治理功能的所有问题进行的归类和跟踪,以及进行培训、咨询和项目实施支持等增值活动的情况。

  · 衡量数据治理成功与否的一个重要标准是看数据治理项目的参与和共享水平以及产生的影响。虽然这些衡量标准不能表现业务价值,但可在实施数据管理工作时,让赞助者看到早期数据治理工作的进展。

  业务价值/投资回报率(ROI)。衡量数据治理投资的业务价值涉及对多种效益的衡量,其中包括,遵从规章减少损失;降低企业风险(例如,合同风险、法律风险、财务风险、品牌风险);降低成本(例如,业务成本、劳动力成本、软件成本、硬件成本);优化支出(例如,采购、供应链、服务、劳动力);提高工作效率(例如,员工、合作伙伴、承包人);增加收入增长;以及优化客户体验和满意度。

  · 如果没有衡量数据治理工作价值和有效性的方法,数据治理工作将不会获得赞助、资源、资金或优先权。

  作者简介:

  Rob Karel是Informatica公司产品战略副总裁,致力于在整个Informatica产品家族中开发和实施全面的数据治理战略和解决方案。

0
相关文章