AI炒作与盈利之间的缺失步骤

MIT Technology Review AI··作者 Will Douglas Heaven

关键信息

Anthropic 和 Mercor 的研究表明,AI 模型在银行或法律等真实任务中经常失败,许多关于岗位影响的预测都是推测性的,而非基于实证。

资讯摘要

文章批评了AI行业的失败之处:在构建强大模型之后,未能定义如何实现盈利。它引用了Pause AI发布的传单,其内容模仿《南方公园》中的‘内裤小矮人’笑话:第一步:构建AI;第二步:?;第三步:赚钱。

一些人认为监管是缺失的一环,另一些人则相信通过经济转型即可找到路径。然而,最近的研究表明,AI代理在现实任务中表现不佳,且由于现有流程和人为因素,部署仍面临重大挑战。

AI炒作与盈利之间的缺失步骤

资讯正文

这个故事最初刊登在《算法》(The Algorithm)周刊上,这是我们的每周人工智能新闻简报。要第一时间收到此类内容,请点击这里订阅。

今年2月,我在伦敦的一场反人工智能游行中拿到了一张传单。我不确定其作者是否故意戏仿了《南方公园》中的内裤小矮人。但如果真是这样,他们确实做到了:上面写着,“第一步:培养一个数字超级大脑;第二步:?;第三步:?”

这张传单由Pause AI制作,这是一个国际活动组织,也是此次抗议的联合发起方。它最后呼吁读者:“暂停人工智能的发展,直到我们搞清楚第二步到底是什么。”

在1998年播出的《南方公园》剧集《小矮人》中,肯尼、凯尔、卡特曼和斯坦发现了一群夜间偷偷从抽屉里偷走内裤的小矮人。为什么这么做?小矮人们展示了自己的商业计划书:“第一阶段:收集内裤;第二阶段:?;第三阶段:盈利。”

这个荒诞的商业模式后来成为互联网迷因中的经典之作,被用来讽刺从初创公司策略到政策提案的各种现象。首席迷因制造者埃隆·马斯克曾在一次演讲中引用过它,当时他正在谈论如何为火星任务融资。如今,这恰好概括了人工智能的现状:企业已经构建出技术(第一步),并承诺带来变革(第三步)。但如何实现这一目标,仍是一个巨大的问号。

对于Pause AI而言,第二步必须涉及某种形式的监管。不过具体会提出什么要求,以及由谁来执行,目前仍在讨论之中。

另一方面,AI的支持者则坚信第三步就是救赎,往往对中间环节视而不见。他们认为人类正骑着一种‘具有经济颠覆性的技术’奔向光明的未来,正如OpenAI首席科学家雅库布·帕霍奇基几周前对我说的那样。他们知道自己想去哪里——大致如此:目的地模糊不清,距离还远。但每个人走的路都不一样。他们都能抵达吗?有人能吗?

每一个关于未来的宏大宣言背后,都有一个更冷静务实的评估,揭示现实与炒作之间的差距。比如最近有两项研究就体现了这一点。一项来自Anthropic的研究预测了哪些职业将最受到大语言模型的影响。(一个关键结论是:管理者、建筑师和媒体从业者应做好改变的准备;园丁、建筑工人和酒店业人员则影响较小。)但这些预测其实只是猜测,基于的是大语言模型擅长完成的任务类型,而非它们在真实工作场景中的实际表现。

另一项由AI招聘初创公司Mercor的研究团队于今年2月发布,他们在480个银行家、咨询师和律师日常执行的工作任务中测试了多个由OpenAI、Anthropic和谷歌DeepMind顶级模型驱动的AI代理。结果发现,所有测试的代理都无法完成大部分分配给它们的任务。

为什么会有如此广泛的分歧?原因有很多。首先,必须考虑是谁在做出这些声明(以及他们为什么要这么说)。Anthropic公司与此密切相关。此外,大多数告诉我们即将发生重大变化的人,主要是基于AI编程工具发展速度得出这一结论的。但并非所有任务都能通过编程解决。其他研究发现,大型语言模型在做出战略判断方面表现不佳。

此外,当这些工具被部署时,并不是简单地扔进一个洁净室里就能运行。它们需要在充满人员和现有工作流程的环境中发挥作用。有时,引入AI反而会让情况变得更糟。当然,也许那些工作流程确实需要彻底推翻,并围绕新技术重新设计,才能实现真正的变革,但这需要时间(以及勇气)。

这个巨大的缺口,就出现在第二步的位置上。人们对即将发生的事情以及如何发生缺乏共识,造成了信息真空,而这种真空往往会被每周最新的夸张说法填满,不管有没有证据支持。我们对即将到来的变化及其实际部署方式几乎毫无理解,以至于一条社交媒体帖子就能(并且确实在)动摇市场。

我们需要的是更少的猜测和更多的证据。而这需要模型开发者提供透明度,研究人员与企业之间加强协作,并开发出新的评估方法,以了解这项技术在现实世界中落地时到底会发生什么。

科技行业(以及整个世界经济)都建立在一种期待之上:AI真的会带来变革。但目前这还不是一个确定无疑的结果。下次你听到关于未来的宏大宣言时,请记住:大多数企业仍在思考该如何处理自己的内裤。

来源与参考

  1. 原始链接
  2. The missing step between hype and profit

收录于 2026-04-28