数据库 频道

读懂“5V”开启人工智能新时代|人工智能系列

早在 2010 年,我就向很多大型企业介绍过大数据的 5V的五个 V :数量、速度、多样性、真实性和价值。当时,随着企业努力应对数字信息的爆炸式增长,这一概念越来越受到关注。近 15 年后,这五个 V 仍然与人工智能高度相关。

科技界已经取得了长足进步,但 5 个 V 背后的核心理念比以往任何时候都更为重要,也是应对数据驱动世界中人工智能挑战的坚实基础。让我们深入研究一下为什么每个 V 在今天仍然重要。

数量:为人工智能引擎提供动力

2010 年,数据专家开始意识到大数据的庞大规模。如今,人工智能依靠这种数据爆炸式增长而蓬勃发展,尤其是在训练机器学习模型方面。海量数据集的可用性决定了人工智能模型的泛化能力和有效执行能力。

但数据量大,责任也大。每天都会产生大量数据,这对组织而言是处理其最重要资产之一的挑战。企业在使用数据时必须负责任地存储、处理、保护数据,并确保最高的道德标准,以确保其 AI 计划既可持续又有影响力。

速度:对速度的需求

数据速度一直是一个挑战,但它改变了人工智能领域。欺诈检测、个性化推荐和自主系统等实时应用需要即时洞察。2010 年,重点是快速移动的数据流;今天,我们还讨论了人工智能决策中的延迟。

人工智能需要像它使用的数据一样快速灵活。它需要坚实的基础设施设置来跟上快速变化的数据并确保实时预测准确无误。

多样性:超越结构化数据

多样性曾经是处理结构化和非结构化数据的代名词。如今,人工智能通过整合多种数据类型(文本、图像、音频、视频等)扩展了这一挑战。想想能理解文本的聊天机器人、能解释语音的语音助手,或者结合视觉和语言的多模式人工智能。

多样性丰富了人工智能的能力,使其更像人类,适应性更强。但它也带来了数据集成和协调的复杂性,需要周密的准备和管理。

真实性:信任的基础

2010 年,真实性意味着确保数据干净可靠。如今,在人工智能时代,真实性是处理数据偏见、错误和道德问题时的核心。不良或有偏见的数据可能会损害结果并导致客户对人工智能系统失去信任。

价值:人工智能成功的真正衡量标准

当我第一次讨论这 5 个 V 时,价值就是将数据转化为有用的见解。如今,这已成为一件大事。人工智能必须通过推动实际业务成果来证明其价值,例如提高效率、削减成本和帮助做出更明智的决策。

价值不仅仅关乎商业,还关乎为社会做出贡献。无论是在医疗保健还是教育领域,人工智能都有能力解决重大的全球问题。但要真正释放这种潜力,组织需要确保他们的人工智能项目符合他们的目标,并真正为有意义的事情做出贡献。

为什么“5V”比以往任何时候都重要

回顾我在 2010 年的演讲,我很惊讶这五项原则仍然具有现实意义和重要性,尤其是在当今人工智能带来的所有挑战的情况下。随着越来越多的组织采用人工智能,这五个 V 提供了一个简单、永恒的指南,可帮助您正确使用人工智能:

数量 ——确保我们拥有推动人工智能所需的数据。

速度 ——驱动实时应用和响应能力。

多样性 ——使人工智能能够处理现代数据的复杂性。

真实性 ——建立降低风险和道德实施所必需的信任。

价值 ——让我们专注于重要的结果。

这些原则不仅仅是技术细节,更是哲学。采用这五个 V 有助于我们创建不仅功能强大而且负责任、可扩展且旨在造福所有人的 AI 系统。

展望未来

当我们步入人工智能驱动的未来时,我们学到的经验教训将继续照亮我们前进的道路。这五个 V 提醒我们,人工智能不仅仅是一种工具,更是创新的心跳。无论是 2010 年、2025 年还是更远的未来,这些原则不断向我们展示如何谨慎、富有创造力地对待人工智能,并专注于做伟大的事情。

在当今世界,数据已成为公司可以拥有的最有力的资产之一。它不仅具有推动创新的潜力,还可以增强决策能力并创造竞争优势。然而,能力越大,责任越大。当组织轻率地对待数据时,如果没有适当的治理、背景或道德考虑,它可能对个人、社区甚至社会造成重大伤害。如果处理不当,数据可能会从强大的资产变成危险的武器。

数据处理粗心大意现象的兴起

在许多组织中,尤其是那些刚接触数据管理的组织,数据通常被视为一种抽象或纯技术资源。它是 IT 部门管理或用于分析以推动洞察力的东西。然而,这种观点忽略了一个关键事实:数据与人有关。无论是客户数据、员工数据还是敏感的商业信息,现实生活和生计都与这些行和列息息相关。了解这一人为因素对于负责任的数据管理至关重要。

然而,企业往往无法认识到这一人为因素。有时,数据处理不当,是因为无知或疏忽。当产品所有者或业务团队在没有适当指导的情况下接收新数据时,他们就为潜在的滥用打开了大门。当组织将数据视为资产,但不将其作为资产保护时,就会发生这种情况。他们随意对待数据,让错误的假设、松散的控制和有偏见的解释盛行。以这些方式错误处理数据可能会产生非常严重的后果。

据《哈佛商业评论》报道,不良数据每年给美国经济造成高达 3.1 万亿美元的损失,主要原因是生产力损失和运营成本增加。根据 Experian 的《全球数据管理报告》,组织花费 30-50% 的时间来修复数据错误和管理返工。这些数字说明了不谨慎使用数据对日常业务运营的影响有多么普遍,强调了负责任的数据管理的必要性。

数据滥用及其对个人的影响

对数据处理不慎可能会导致侵犯隐私和保密性。例如,个人的个人数据可能会因数据泄露而暴露。2021 年,身份盗窃资源中心 (ITRC) 报告称,美国数据泄露事件增加了 68%,2.94 亿人面临身份盗窃和金融欺诈的风险。但这不仅仅是泄密。不正确的数据可能会导致有害的决定——根据错误的信用信息拒绝向某人提供贷款,或在健康保险单中将其错误分类。数据可能会强化系统性偏见,尤其是当历史不平等被纳入算法时。如果数据被滥用,它会强化歧视,使那些已经被边缘化的人更加脆弱。

此外,当组织未经同意或未清楚了解其影响而使用个人数据时,信任度也会受到削弱。普华永道的一项调查显示,如果消费者对公司的数据安全做法有顾虑,85% 的消费者将不会与其做生意。当信息被不当处理时,人们会感到受到侵犯,并对本应保护他们的机构失去信心。

在医疗保健等行业,影响更为深远。根据 IBM 的数据泄露成本报告,2023 年医疗保健数据泄露的平均成本为 1093 万美元,高于任何其他行业。除了财务影响外,医疗保健泄露还可能泄露敏感的患者信息,使个人面临情感、社会和经济伤害的风险。

随意使用数据带来的商业和社会成本

当组织将数据视为一种免费资源时,他们往往会忽略这种方法带来的隐性成本。粗心的数据实践有时会导致所谓的“隐藏数据工厂”的产生,手动返工和低效流程会降低生产力。更糟糕的是,当出现问题时,这些做法可能会导致监管罚款、法律纠纷和声誉受损。

例如,2023 年,Meta(Facebook)因违反《通用数据保护条例》(GDPR)面临 13 亿美元罚款,这是该条例生效以来最严重的罚款。这清楚地提醒组织不能掉以轻心数据管理。

在社会层面,数据滥用会加剧刻板印象,将边缘群体排除在服务之外,甚至操纵公众舆论。AI Now Institute 的一项研究发现,在招聘或贷款等高风险决策中使用的算法中,58% 表现出对少数群体的偏见。这可能会造成实际伤害,例如不公平地拒绝人们贷款或工作。在刑事司法系统中,使用有偏见的算法(如 COMPAS(替代制裁的惩教罪犯管理分析))已被证明会错误地预测黑人被告的再犯率高于白人被告,这表明当数据被不小心使用时,算法偏见会产生破坏性影响。

从数据疏忽到数据问责

组织必须转变处理数据的思维方式。首先要明白,数据治理不仅仅是一个 IT 问题,而是一项业务责任。数据不仅仅是一种可供挖掘见解的资源;它还是一项反映和影响人类生活的重要资产。

适当的数据治理实践必须融入组织的每一层,从高层领导到产品团队。这意味着建立明确的数据所有权结构,实施强大的安全协议,并确保数据收集、使用和存储方式的透明度。

此外,企业必须具备责任心。必须提出以下关键问题:

  • 我们是否考虑过我们的数据实践对个人的影响?

  • 我们是否允许偏见渗透到我们的算法中?

  • 我们收集和使用数据的方式是否透明且合乎道德?

未能解决这些问题的后果是严重的。思科的 2023 年数据隐私基准研究显示,90% 的组织由于客户数据隐私问题而经历了销售周期延迟。不谨慎的数据处理会损害人们的利益、减缓业务运营并影响收入增长。

通过合乎道德的数据实践赋予人们权力

数据应该赋予人们力量,而不是伤害他们。如果谨慎负责地处理数据,它有可能改善生活、创造公平并推动进步。然而,如果处理不当,它可能会加剧不平等并削弱信任。

合乎道德的数据实践不仅是监管的必要条件,也是道德义务。埃森哲的数字信任调查发现,重视数据道德的公司消费者信任度提升了 11%,从而推动了忠诚度和增长。通过尊重数据、确保数据完整性并负责任地使用数据,组织不仅可以避免数据处理不当带来的负面影响,还可以为更加公正和公平的社会做出贡献。

在这个数据决定我们决策的时代,让我们记住,人是每个数据点的核心。每个人都应该得到有尊严的对待,而不是被当作可以随意操纵的统计数据。

行动呼吁

随着我们继续进入大数据和人工智能时代,负责任的数据管理的重要性怎么强调也不为过。现在是时候让组织认真审视他们的数据实践,并确保AI为服务对象谋福利,而不是与他们作对。

数据不仅仅是数字——它是一个故事、一段生活、一个人。

0
相关文章