数据库 频道

良好数据治理的 6 个最佳实践

  原文作者:Bob Violino

  编译:商业智能研究

  为什么良好的数据治理如此重要?

  有没有考虑过没有它可能会产生什么结果:数据质量差、数据难以使用、数据缺乏完整性、数据口径不一致,业务用户几乎无法使用……

  换句话说,从业务的角度来看,没有数据治理的数据几乎没有价值。

  正如数据治理研究所定义的那样,“数据治理是一个信息相关过程的决策权和责任体系,它按照约定的模型执行,该模型描述了谁可以对什么信息采取什么行动,以及何时,在什么情况下,使用什么方法。”

  当越来越多的企业和组织开始进行数字化转型,也使数据治理对企业来说变得更加重要,因为大多数业务的成功都取决于数据的可靠性、安全性以及数据用户的场景适配性。

  毫无疑问,对数据治理产品和服务的需求正在上升。研究公司 Markets and Markets 估计,全球数据治理市场将从 2020 年的 21 亿美元增长到 2025 年的 57 亿美元,预测期内复合年增长率 (CAGR) 为 22%。

  报告称,数据量的快速增长、监管、合规要求的提高以及业务合作的增加等因素预计将推动市场的增长。它表示,随着世界各地政府实体出台多项数据隐私法规,确保组织内的数据得到适当的存储、使用和丢弃变得愈加重要。

  该公司还表示,影响数据治理需求增长的另一个因素是,软件开发中越来越多地采用了DevOps。报告指出,DevOps的采用与数据治理计划的实施之间存在着很强的相关性。

  通过遵循一些最佳实践,组织可以创建有效的数据治理计划。

  一、识别关键数据元素并将数据视为战略资源

  并非所有数据都是重要的,要想实现良好的数据治理,首先就是要了解数据基础架构中的哪些方面对业务最关键。

  “当纵览整个架构时,你会发现这些关键数据元素涉及数十到数百个系统和应用程序,”新泽西州司法机构的首席信息官 Jack McCarthy 说。

  在更基础的层面上,组织需要了解数据对业务成功的重要性,尤其是组织最高层级,这有助于培养数据治理的文化,

  “我的经验是,数据治理的有效性源于企业愿意并能够将数据作为一项重要的战略资产,”宾夕法尼亚州印第安纳大学的 CIO Bill Balint 说。

  “将原始数据转化为可以产生积极结果的数据不能被视为事后的想法,”巴林特说。

  二、为整个数据生命周期制定政策和流程

  数据只不存在于单个时间点。它由源创建、清理、更新、存储、分析、传输、备份、删除等。生命周期的每一步都有潜在的接触点,要想在各个阶段很好地管理数据,就需要需要为每个阶段制定管理政策略和流程。

  “确定数据归属以及哪些系统或人员可以在整个生命周期中更改数据,”麦卡锡说。他补充说,通过这种方式,组织可以提供审计跟踪和其他数据检查点,以确保对数据元素有一个完整和透彻的理解。

  一个很好的例子说明了政策的必要性,新泽西州司法机构正在考虑对刑事司法改革进行风险评估,以消除该州的保释金。

  “当我们希望收集数据并确定自动化评估工具评分所需的关键要素时,我们继续进一步回到逮捕的生命周期,”麦卡锡说。“我们发现,在向法院提交逮捕令时,必要的数据并不存在。数据的来源发生在更早的时候,因为执法部门完成了指纹检查以识别被告。通过追溯数据的来源,我们能够向内部和外部合作伙伴发布指令和政策,以确保我们正在构建的系统的关键元素可供我们以及其他下游合作伙伴使用。”

  三、让业务用户参与治理过程

  业务用户通常是良好数据治理的最大受益者之一,因为它使他们能够拥有高质量的数据来帮助他们更好地完成工作。而要想让数据治理产生价值,他们也应该参与治理过程。

  “我喜欢与数据所归属部门的同事组成一个用户组,”包装公司 Alpha Packaging 的技术高级副总裁兼 CIO Bryan Phillips 说。“然后,我希望让他们对正在开展的工作和优先事项进行一定程度的预算控制。”

  菲利普斯说,这往往会促进各部门之间的合作,促进知识共享,甚至可以创造一些友好的竞争。

  他还说,“数据所有者通常是最适合对其数据进行分类的人,没有人比他们更了解数据”,“通过建立这样的小组,也可以帮助我们很快的定位和解决数据问题。

  四、不要忽视主数据管理

  数据治理应包括管理主数据,即为所有业务提供上下文的业务数据。有效的主数据管理可以提高数据的一致性和准确性。

  “必须关注主数据的标准化和/或交叉引用,”菲利普斯说。“这往往是最容易被忽视的地方,没有它,数据可能会变得孤立,无法关联跨域数据。

  主数据管理小组应该与业务用户保持密切的联系。菲利普斯说,理想情况下,负责主数据管理的小组应该是一个跨多个部门的业务职能部门,而不是 IT 部门的一部分。

  五、了解信息的价值

  从某些方面来看,数据治理这个词用的不太恰当,因为它不一定能反映从信息中挖掘到的观点的真正价值。

  医疗咨询公司Impact Advisors的高级顾问Marc Johnson说:“信息是为组织创造价值的数据之间的关联。在医疗公司这包括财务记录、患者记录、员工记录等。”

  “数据治理需要的不仅仅是数据分类,”约翰逊说。“它需要信息分类。信息分类表明了对组织的价值以及如果丢失、被盗或毁坏的后续影响。” 他举了一个员工通过电子邮件将信息从公司帐户发送到私人帐户的例子。

  “我们已经做好了预防数据丢失的措施,以防受电子保护的健康信息被泄露,”约翰逊说。“如果我们不采取措施对信息进行分类(而不仅仅是数据),我们可能就需要面临一个杂乱的任务列表;如果我们没有进行额外的尽职调查,那我们的系统中可能会有成千上万的误报,导致警报疲劳、网络流量过大,以及安全运营中心的警报状态不必要地升高。”

  数据治理需要详细的尽职调查,以了解谁可以访问哪些信息以及该信息对组织、其客户、员工、合作伙伴和其他人的价值。

  “如果一个组织在数据治理过程中不够深入,他们就会面临对其业务基础(信息)的保护、可用性和恢复设计过度甚至设计不足的风险,”约翰逊说。

  六、不要过度限制数据使用

  鉴于信息资源的竞争价值以及重大的安全和隐私风险,IT 管理者可能倾向于严格限制数据的分发和使用方式。这可能会使数据治理在组织中看起来更像是一种消极而非积极的做法——并最终阻碍创新。

  保险提供商 (WAEPA) 的首席信息官布兰登·琼斯 (Brandon Jones) 表示,严格的限制“会限制价值创造并抑制商业价值”。“还会导致业务用户对企业技术的不满和抵制采用。”

  琼斯说,WAEPA 已经构建了综合的数据平台,可根据业务利益相关者的需求,将不同来源的数据聚合到一个平台中。目标包括提高数据的可访问性、准确性和完整性,以更好地支持业务决策。

  “IT部门应不断发展以满足业务的需求,为此,每个利益相关者都需要能够做出贡献,”琼斯说。他们还需要方便、安全地访问与工作相关的信息。

  “数据治理的目的是确保问题得到解决,以及如何利用数据去为解决这些问题提供支持”琼斯说。

0
相关文章