数据库 频道

你需要这样一个数据治理框架

在过去 10 多年里,我有机会为各个行业撰写或贡献了多种数据治理策略和框架。虽然每个组织都有其独特的挑战,但我发现特定的通用框架始终是实施数据治理的有效起点。

尽早建立清晰的框架至关重要。它阐明了什么是数据治理,什么不是数据治理,有助于避免混淆、设定期望并推动采用。结构良好的框架提供了简单、可重复的视觉效果,您可以反复使用它来解释数据治理以及您计划如何在整个组织中实施它。

在本文中,我将分解我的个人框架的五个基本组成部分,提供适用于任何组织、任何行业的实用方法。

一 战略

明确的战略是任何成功数据治理计划的基础。它确定了治理工作的目的、方向和优先事项,确保与业务目标保持一致。如果没有明确的战略,数据治理计划将变得支离破碎且被动。

  • 使命、愿景和总体战略。

    该子组件定义了数据治理的必要性、其目标是什么以及如何实施。使命阐明了治理的核心目的,例如确保数据完整性、合规性和价值创造。愿景提供了长期展望,描述了组织内数据治理的理想状态。总体战略概述了将治理嵌入业务运营的方法和指导原则。

  • 目标和价值。为了取得有意义的成果,数据治理必须与可衡量的目标

    挂钩。这包括设定具体的、可量化的目标,例如将数据质量分数提高一定百分比、降低合规风险或增加元数据采用率。明确的目标可确保问责制,并使组织能够跟踪进度、展示价值并不断改进其治理工作。

二 能力领域

为了有效实施数据治理,组织必须开发一套核心能力领域,以解决管理数据所需的政策、流程和结构。这些能力领域是治理的基石,确保涵盖从数据质量到安全性的所有关键方面。一套定义明确的能力可确保治理工作相互排斥且全面详尽 (MECE),避免出现差距或冗余。

  • 政策、标准和合规性。

    治理始于明确的政策和标准,这些政策和标准为整个组织的数据管理建立了规则、指导方针和合规性要求。政策定义了必须做什么——围绕数据访问、质量和保护等主题设定期望——而标准则定义了如何通过特定程序或阈值实现这些期望。至关重要的是,治理还必须包括通过监控、报告和审计机制证明遵守这些政策和标准的能力,确保问责制和监管一致性。

  • 数据治理。

    将“数据治理”作为数据治理框架中的一项功能似乎有点奇怪,但它具有独特而基础的目的。此功能定义并实施整个治理模型中的角色、职责和问责制。它提供了支持所有其他功能的组织框架,明确了谁负责哪些决策和活动、如何分配所有权以及如何在业务和 IT 之间协调治理活动。这包括定义数据所有者、管理员、领域负责人、升级路径和治理论坛。

  • 元数据和编目。

    元数据(有关数据的数据)对于理解、组织和管理信息资产至关重要。此功能将元数据管理与数据目录和发现工具相结合,以提供数据资产的集中清单,包括业务定义、技术元数据和数据沿袭。元数据管理还涉及定义最低元数据标准,确定必须捕获和维护哪些元数据以及在哪里。数据目录在此基础上建立,使元数据可搜索和访问,使用户能够找到、理解和信任他们使用的数据。这推动了透明度和数据民主化,使整个组织中的更多用户能够访问他们需要的数据。

  • 数据架构。

    本文介绍的是数据治理框架,而不是企业架构或解决方案架构框架。因此,数据架构在这里的作用仅限于与数据治理相交叉的方面。这包括确保通过变更程序、解决方案设计流程和架构治理机制,在新系统、数据流和流程的生命周期早期嵌入正确的数据治理控制和考虑因素。这种协调至关重要,因为在设计阶段实施数据治理的投资回报率要高得多,而不是在系统构建和部署后改造治理控制。通过这种方式,数据架构成为整个企业可持续、符合政策的数据管理的推动者。

  • 数据质量管理。

    高质量数据是可靠分析、人工智能、监管报告和日常业务运营的基础。此功能涵盖一系列确保数据符合用途的活动,通常可分为几个不同的领域。首先,它从了解数据和阐明明确的业务需求开始——需要什么数据、在什么级别的准确性、及时性或完整性以及用于什么目的。一旦确定了这些要求,组织就可以确保将正确的数据质量控制嵌入到运营流程中,以从源头上防止问题(例如,表单中的验证规则或数据管道中的自动检查)。一个独立但密切相关的功能侧重于数据质量本身的测量,使用定义的指标和分析技术根据业务要求评估数据。此外,数据质量功能还可以包括问题管理:用于识别、记录、跟踪和补救数据问题的结构化流程。这使组织不仅能够对数据问题做出反应,还能分析根本原因并实施持久的改进,确保数据在长期内保持可信度。

  • 主数据和参考数据。

    主数据和参考数据管理管理核心业务数据实体(例如客户、产品、供应商),以消除重复、提高一致性并实现单一事实来源。在许多组织中,此功能由主数据管理 (MDM) 平台支持。MDM 平台提供集中式工作流、黄金记录创建、数据匹配和跨系统同步。它在确保数据一致性、完整性和准确性方面发挥着关键作用,尤其是对于企业范围的报告和交易处理。

  • 数据安全。

    数据安全确保敏感、关键和受监管的数据根据治理政策和数据分类方案受到保护,以免未经授权的访问、滥用或泄露。这包括实施和监控基于角色的访问控制、加密、标记化、屏蔽、安全数据传输协议和职责分离。有效的数据安全治理还可确保安全措施符合已批准的数据使用政策,并通过合规性检查和风险评估进行定期测试和证明。

  • 道德与隐私。

    从技术上讲,这一领域可以解释为属于政策、标准和合规性,因为许多道德和隐私要求最终都是通过正式政策进行管理的。然而,由于其相关性和可见性日益增强,因此通常值得单独提出来——尤其是随着人工智能、算法决策的兴起和监管审查的加强。这一能力侧重于通过定义道德原则、隐私实践、同意管理流程和个人数据保护策略来确保负责任、公平和透明地使用数据。鉴于信任和问责制在数据驱动型组织中的重要性,将道德与隐私视为一项独特的能力有助于确保它获得所需的可见性、所有权和资源。

  • 数据素养和文化。

    治理不是(或者说不应该是)仅仅与控制有关。它还涉及授权人们有效且负责任地使用数据。此功能通过为业务和技术用户提供他们解读、信任和处理数据所需的培训、知识和工具来促进数据素养。它包括宣传活动、教育资源、最 佳实践和自助服务支持,以在整个组织内培养数据驱动的文化。

定制化框架:

在我参与的每项工作中,上述能力领域都已被证明是一个很好的起点。但每个组织都有自己的背景、运营模式、优先事项和历史,因此,我经常花大量时间与客户组织一起完善此列表,以最好地适应他们的独特情况。以下是适应能力模型的一些最常见维度:

  • 数据安全和数据架构有时并未明确列为数据治理能力框架的一部分。在许多组织中,它们被视为 IT 或技术职能部门的责任,而治理考量则被认为嵌入更广泛的架构和安全治理流程中。

  • 数据素养有时会被重新命名或重新定义,被称为变革管理、数据赋能、数据传播或数据拥护。在所有情况下,其根本目的都非常相似,即赋能用户并培养数据驱动的文化。

  • 道德与隐私有时完全融入更广泛的“政策、标准和合规性”能力中,特别是当道德和隐私原则已经通过政策工具正式编纂成法典时。在这些情况下,重点是了解相关的监管要求(例如 GDPR、HIPAA 或与 AI 相关的法律),将其转化为可操作的政策和标准,然后通过治理结构、培训和监督机制推动合规性。

  • 一些组织表示有兴趣将 AI 或分析支持作为一项单独的功能,或对它们进行治理(“AI 治理”)。就我个人而言,我发现实现可信分析和 AI 所需的大部分功能都可以而且应该通过现有功能来处理。然而,我合作过的少数组织选择将其视为一项单独的功能,尤其是在 AI/ML 模型治理是当前优先事项的情况下。

三 实施采用和执行

虽然数据治理的战略和能力领域大体上是通用的,但治理的实施在不同组织、行业和监管环境中可能存在很大差异。此部分侧重于治理在组织中的结构、嵌入和操作方式。它涉及如何“实施”治理 — 如何在实地推动执行。

框架的这一部分在某种程度上与我个人对数据治理的看法不同。虽然大多数组织通过一系列能力或支柱来定义治理,但他们没有整合治理的实际实施方式。我故意将其作为核心框架的一部分,因为我认为,如果没有明确的执行和采用路径,治理就有可能停留在理论层面。将实施直接嵌入框架中,可以强化治理必须是可操作的、活生生的,并嵌入到日常运营中——而不仅仅是一套良好的意图。

您对实施的看法可能有所不同,但我通常会提到两个关键组成部分:角色和领域。定义角色(如数据所有者或管理员)有助于明确谁负责什么,并确保整个组织的一致性。定义领域(如客户、产品或财务数据)有助于围绕逻辑业务分组构建治理。这些组件共同实现了领域驱动的数据治理方法 - 这意味着将治理职责嵌入最了解数据的业务领域,并在上下文中而不是孤立地执行治理。

1.关键角色和职责

可以通过定义一组角色来明确所有权和责任。虽然数据治理涉及许多角色,但以下角色代表了数据领域中经常重复的一些最重要的角色:

  • 域所有者。

    负责监督特定业务领域(如客户数据、财务或产品)内的治理。他们帮助确定工作优先顺序,确保与业务目标保持一致,并对其领域内治理的成功负责。

  • 数据所有者。

    负责特定数据(或数据集)的质量、安全性和生命周期。他们就数据的使用、访问和关键治理要求做出决策。

  • 数据管理员。

    通常代表数据或域所有者工作,执行数据治理所涉及的大部分日常工作。这包括执行标准、维护元数据、支持数据质量计划以及协调问题解决。

  • 系统所有者。

    负责存储、处理或共享数据的技术系统和平台。他们确保将治理要求融入这些系统的架构、控制和访问层中。

  • 业务流程所有者。

    确保治理政策和数据标准融入收集、创建或修改数据的业务流程中。它们有助于将治理嵌入运营工作流和流程设计中。

2.数据域

治理可以应用于有意义的业务环境,即数据域。这些域根据数据在组织内的使用方式定义数据的逻辑分组。虽然具体域会因行业而异(因此,框架的这一部分必然是定制的),但以下示例说明了零售公司如何构建其数据域:

  • 客户

    ——有关购买或使用您的产品或服务的个人或组织的信息。

  • 产品

    ——有关所提供商品或服务的详细信息,包括结构、定价和描述。

  • 供应商

    — 有关供应商、其合同以及其表现的信息。

  • 财务

    ——收入、支出、预算和其他财务交易的记录。

  • 员工

    ——有关员工的信息,包括职位、薪酬和人力资源历史。

  • 销售

    ——有关购买、交易和创收活动的数据。

  • 库存和供应链

    ——跟踪库存水平、产品流动和交付流程。

  • 营销和活动

    ——捕捉活动活动、广告支出和定位策略。

  • 合规性和监管性

    ——用于满足法律、审计和监管义务的数据。

  • 数字和网络分析

    ——衡量用户如何与数字平台和网站互动。

四 技术支持

技术在使数据治理变得实用和可扩展方面起着至关重要的作用。虽然这些技术与数据治理的关键能力领域相一致,但它们并不是 1:1 对应的,因为许多能力由更广泛的技术堆栈或集成解决方案支持。此外,组织构建和部署这些技术的方式可能会因其规模、行业和数据成熟度而有很大差异。

话虽如此,在大多数情况下,数据治理相关的技术可以分为以下主要类别。

  • 数据管理平台。

    这些平台使组织能够定义和管理数据所有权、管理职责、工作流和审批,以及促进问题记录、数据变更请求和证明等治理操作。它们还越来越多地支持基于工作流的问题管理,使组织能够跨团队分配、跟踪和解决数据治理问题。这些工具使治理可行且跨领域。

    示例:Pcitc-数据治理套件、Collibra、Informatica Axon、Alation Stewardship Workbench

  • 数据质量。

    确保高质量数据需要专门的监控、分析、清理和补救工具。这些解决方案可以识别不一致、缺失值和错误,使团队能够实时修复数据问题并在整个系统中执行数据质量标准。

    示例:Informatica Data Quality、Talend、Ataccama ONE

  • 数据目录和可观察性。

    数据目录提供数据资产的中央清单,结合元数据、沿袭和业务定义,以增强数据发现和透明度。目录越来越多地与数据可观察性工具配对,以实时监控数据健康、新鲜度和行为。一些工具还提供跨数据环境的自动数据扫描和分类。

    示例:Alation、Collibra、BigID

  • 主数据管理。

    MDM 平台对于管理客户、产品和供应商等核心业务实体至关重要。这些工具支持数据匹配、黄金记录创建、验证工作流以及跨系统主数据的同步。它们是实现企业范围一致性、重复数据删除和关键数据域单一真实来源的关键。

    示例:Pcitc-MDM、Informatica MDM、Reltio

  • 数据安全解决方案。

    此类别包括管理访问控制、加密、屏蔽、标记化和安全数据传输的工具。它还支持数据访问请求工作流,确保只有授权用户才能根据治理策略和数据分类访问敏感或机密数据。

    示例:Immuta、Privacera、Microsoft Purview Data Security

  • 道德、隐私和合规性监控。

    这些工具支持道德数据使用、隐私法规(例如 GDPR、HIPAA)和内部政策的执行和监控。它们提供数据主体权利管理、同意跟踪、审计跟踪和使用情况监控功能,这些对于建立信任和履行监管义务至关重要。

示例:BigID、OneTrust、Collibra Protect

在创建框架的这一部分时,你可以用你正在使用的实际工具和平台替换通用类别,例如列出Collibra而不是“数据管理平台”,或列出 Informatica Data Quality而不是“数据质量工具”。这提供了更切实的、特定于组织的视图,展示了特定技术如何实现关键功能。

五 数据治理的治理

要使数据治理发挥作用,就需要明确的协调、持续的监督和稳步的进展。这就是数据治理的意义所在——确保框架的其余部分真正得到完成。它为所有部分如何协同工作提供了结构,并让人们承担责任。

1.政策与标准

政策和标准是数据治理的基础。它们定义了规则、期望和责任,就像道路上的交通法规一样。框架中的其他所有内容都指向它们。政策设定方向,标准使其成为现实:

政策规定了必须做什么。这是一条明确的规则,例如“必须保护客户数据” 。

标准说明了如何做到这一点。它给出了细节,例如“加密客户数据并保存 3 年。”

2.治理架构

治理架构为数据治理提供必要的监督、协调和决策结构。虽然具体架构取决于组织的结构和治理需求,但常见的类型包括:

  • 企业数据治理委员会。

    制定战略方向、解决跨职能问题并确保治理与业务目标保持一致的中央机构。

  • 特定领域的数据治理组织。

    负责监督特定数据领域(例如客户、财务、产品)治理的小组,确保实施领域级政策,同时将关键问题上报至企业级。

  • 区域或业务部门治理组织。

    在全球或分散的组织中,数据治理可能按照区域、业务部门或部门划分进行构建,以满足当地要求、监管变化和运营需求。

  • 特定能力工作组。

    一些组织设立了专注于特定能力(例如数据质量、元数据管理、数据安全或数据伦理)的治理小组,以推动最 佳实践和技术实施。

3.指标与绩效衡量

为了证明数据治理的有效性和影响力,组织必须跟踪关键绩效指标 (KPI),例如数据质量分数、政策遵守率、治理问题解决时间和元数据采用率。这些指标有助于证明投资的合理性、发现差距并推动持续改进。

4.变革管理

为了使治理真正深入人心,您可以通过培训计划、沟通策略和参与计划等方式来推动意识、采用和行为改变。

六 小结

强大的数据治理框架提供了清晰、结构化和可重复、可扩展的数据治理方法。虽然每家公司的治理历程都是独 一无二的,但本文提出的框架是一个经过验证的起点——可以根据任何行业、任何组织和任何数据成熟度水平进行量身定制。关键在于尽早建立它、清晰地传达它并深深地植入它。

0