研究人员警告美国政界正在重蹈ChatGPT的覆辙，忽视世界模型的重要性

The Decoder·4月23日 21:33 UTC·作者 Maximilian Schreiner

关键信息

世界模型处理视频、图像、音频和文本等多模态数据来模拟现实环境，需要先进的计算能力和机器人等物理硬件。与大语言模型不同，它们带来了隐私、劳动力和国家安全等方面的新治理挑战。

资讯摘要

文章指出，美国政策制定者正忽视‘世界模型’的兴起——这类AI系统通过多模态输入理解并预测物理环境。这些模型被认为与大型语言模型一样具有变革性，但不仅需要软件，还需要强大的硬件和供应链支持。斯坦福大学的Russell Wald和杜兰大学的Blaine Fisher警告称，美国正在重蹈ChatGPT时期的错误，直到为时已晚才意识到这些技术的重要性。

与此同时，中国已在机器人领域取得进展，例如一款双足机器人打破了人类半程马拉松纪录。这种准备不足不仅威胁经济竞争力，还可能影响国家安全和社会稳定。

资讯正文

研究人员警告：美国政治正在重复其在ChatGPT上的错误，忽视世界模型的发展

人工智能发展的下一阶段正从文本转向物理世界。研究人员警告称，美国政策制定者尚未意识到即将到来的变革规模，而中国已在机器人领域领先。

大型语言模型能够预测句子中的下一个词，而所谓的“世界模型”则能预测物理环境中的可能事件。它们通过分析来自视频、图像、文本、音频及其他传感器的多模态数据来理解三维空间。研究人员认为，这项技术可能和大型语言模型一样具有颠覆性。一些专家，比如AI先驱杨·勒丘恩（Yann LeCun），将其视为高级人工智能的核心构建模块。

应用场景包括仓库和家庭机器人、药物研发中的分子环境模拟以及自动驾驶。所有这些统称为“物理AI”。

但研究人员警告，在政策层面，美国已经落后。据《政客》（Politico）报道，斯坦福大学以人为本的人工智能研究所主任拉塞尔·沃尔德（Russell Wald）回忆起在2022年ChatGPT发布前曾向国会发出关于大型语言模型的警告，但当时被忽视。他现在看到同样的模式正在世界模型上重演，指出许多议员甚至不知道什么是世界模型。

供应链缺失与中国机器人优势

世界模型放大了对计算能力的巨大需求。杜兰大学的布莱恩·费舍尔（Blaine Fisher）告诉《政客》，仅维持语言模型的数据需求就已经很困难，而世界模型还需要机器人等实体硬件。美国科技行业正在推动制定国家机器人战略，以增强供应链并应对中国的竞争。

沃尔德警告说，可能出现类似5G时代的情况：如果世界模型研究取得突破，美国将拥有系统的“大脑”，却缺乏制造硬件所需的供应链。与此同时，中国智能手机制造商荣耀（Honor）最近推出的一款双足机器人刚刚打破了人类半程马拉松纪录。

根据沃尔德的说法，世界模型带来的社会风险远超大型语言模型所引发的常见问题。这类模型需要一种全新的治理方式，尤其是在隐私、劳动力市场及国家安全方面。能够分析真实世界的这一能力可能会显著提升监控能力和自主武器系统。费舍尔还警告称，人们可能会退缩到拥有逼真物理规则和AI化身的虚拟世界中，预测有些人将再也不愿离开家门。

来源与参考

收录于 2026-04-24