数据库 频道

大数据的启示同样适用于人工智能

谈到人工智能,炒作从未停止。我们不断收到警告,称人工智能即将彻底改变世界,如果现在不采用人工智能,我们就可能沦为失败者。从许多方面来看,当前的氛围与大数据热潮初期极为相似。我们从那段经历中吸取了一些(痛苦的)教训,但企业领导者是否还记得?

科技行业变化迅速,且容易出现周期性的非理性繁荣。有一定年龄的人会记得20世纪90年代末的互联网泡沫,当时万维网出现,互联网的商业化开始。当那些早期不稳定的商业模式未能成功,比如pets.com,投资者纷纷撤离,导致2000年的互联网泡沫破裂和2001年至2003年的经济衰退。

本世纪初Web 2.0(JavaScript、AJAX等)的出现带来了更先进的技术,这有助于创建可行的在线商业模式。2005年Facebook的推出、2006年AWS的上线以及2007年iPhone的发布,为社交媒体、云计算和移动电话革命的蓬勃发展奠定了基础。

到2010年,大数据已成为科技界热议的话题。消费者借助更强大的网页浏览器和智能手机开始产生海量数据,而基于通用X86技术的可扩展云系统则提供了新的数据存储与处理方式。雅虎(Yahoo)以谷歌(Google)内部技术为蓝本开发了Hadoop,而NoSQL数据库(同样源自谷歌)也从硅谷的数字沼泽中崭露头角,由此开启了一场为期十年的分布式计算实验。

突然间,每家企业都必须制定大数据战略。我们被告知,如果不“做”大数据,就有可能被更灵活的科技初创公司超越,甚至被街对面的竞争对手超越,因为他们已经全面投入大数据。恐惧与贪婪的氛围蔓延开来,数百亿美元被投入到新技术中,寄希望于这些技术能让企业做好大数据并赢得竞争。

但这个计划有几个问题。虽然Hadoop和NoSQL在某些方面技术上令人印象深刻,但它们并不总是容易采用和管理。开发基于Hadoop的新分布式框架(如Apache Hive、Apache MapReduce、Apache Storm等)的硅谷科技巨头,拥有数千名工程师来确保这些技术正常运行。而现实世界中的中型零售商和制造商则并非如此,他们误以为投资热门新技术就能自动获得竞争优势。

很快,大数据湖变成了大数据沼泽。企业发现,将海量数据存储在Hadoop中并不会神奇地改变其业务运营。魔鬼如往常一样,藏在细节中,这些细节在企业领导者急于实施“最新技术”以领先竞争对手或至少不落后于竞争对手时被忽视了。

Gartner的IT分析师警告称,大多数数据湖项目将以失败告终。他们撰文探讨了“数据湖谬论”,指出数据管理中的捷径必然导致不良后果。毫不意外,最初的数据湖愿景最终导致了大量沉没成本。整个Hadoop实验大约在2015年开始瓦解。一些组织想要让Hadoop为他们工作,大型机在几十年前就被认为已经淘汰,但至今仍在使用,但Hadoop解决方案的商业市场在2019年基本上崩溃了。

Hadoop技术的残余部分仍然存在,并在商业技术中发挥着重要作用。Hadoop分布式文件系统(HDFS)和Hadoop的资源调度器YARN,基本上已被S3兼容的对象存储和Kubernetes取代,后者构成了现代数据堆栈的基础。所有云计算巨头均已推出成功的大数据解决方案。甚至一些Hadoop时代的技术,如取代MapReduce的Apache Spark,以及解决Apache Hive数据一致性问题的Apache Iceberg,也正蓬勃发展。

然而,归根结底,大数据热潮的失败并非源于技术不足。而是源于一种非理性的信念,即新技术本身就能代表一种可行的商业策略。原本理性的商业领袖们不知何故被说服,认为投资某项技术就能神奇地转型业务。但在现实世界中,业务转型要困难得多。

Bill Schmarzo是“没有灵丹妙药”这一观点的最坚定支持者之一,他认为成功的业务转型是精心规划和大量努力工作的结果。十年前,这位“大数据教父”向本刊透露了他用来指导客户的“秘密配方”。他将其称为“SAM测试”,该测试允许企业领导者通过三个维度评估新IT项目的可行性。

  • 首先,新项目是否具有战略性?也就是说,它是否会对公司产生重大影响?如果不会,为什么还要投入大量资金?

  • 其次,拟议的项目是否可行?虽然新技术可能带来一些洞察,但你的业务是否真的能利用它?

  • 第三,项目是否具有实质性?新项目在技术上可能可行,但如果成本超过收益,那么它就是失败的。

目前担任戴尔客户人工智能与数据创新战略师的Schmarzo也是数据治理与数据管理重要性的坚定倡导者。那些曾导致众多大数据项目失败的数据治理与数据管理问题,在人工智能时代也不可避免地再次浮出水面。

这让我们不得不提及当前的人工智能热潮。我们被告知,大型语言模型涉及数万亿美元的利益,我们正处于一场前所未有的技术变革的边缘。作为全球最有价值公司的首席执行官,英伟达的黄仁勋因其芯片在训练人工智能模型中的关键作用,被冠以“AI教父”的称号。我们距离实现人工智能的圣杯——通用人工智能(AGI)仅有短短几年之遥。

这一切可能被证明是真实的,也可能被证明是又一项未能如预期般实现的充满希望的技术,需要数年时间成熟后才能为主流企业带来实际价值,双方都有证据支持。不可否认,语言模型在文档理解和编程等领域展现出惊人的能力,利用人工智能加速科学发现的潜力令人垂涎。然而,我们也看到了熟悉的泡沫过热的警告信号。

恰逢其时,Gartner于6月发布警告称,到2027年,40%的代理型人工智能项目注定会失败。Gartner建议,不要盲目追逐人工智能,而是应确保人工智能“仅在能带来明确价值或投资回报率(ROI)的领域推进”。

人工智能的进步毋庸置疑,但将这一进步转化为商业成功仍是一个难以捉摸的目标。好消息是,通过降低预期、从小处着手、聚焦商业基本面,并应用Schmarzo的SAM测试,企业领导者最终将找到如何盈利地使用人工智能的方法。

0
相关文章