RSI 成为 AI 领域新的 AGI 热词

TechCrunch AI·5月28日 22:30 UTC·作者 Russell Brandom

关键信息

Socher 表示，Recursive Superintelligence 的目标是让构思、实现和验证整个研究流程都自动化。文章也指出，现阶段这些尝试在实践中仍然比较有限：Karpathy 的 Auto-Research 主要只是在 GPT-2 规模模型上做出小幅改进，而更广义的 RSI 设想仍受可靠性和算力限制。

资讯摘要

TechCrunch 报道称，递归自我改进（RSI）正在迅速成为 AI 圈里描述“系统能自我升级”的新流行词。文章重点提到 Richard Socher 创办的 Recursive Superintelligence，以及 Andrej Karpathy、Sara Hooker 等研究者正在推进的相关项目。 RSI 将长期围绕 AGI 的讨论，重新聚焦到一个更可操作的概念：AI 系统能否自己改进研究、训练和部署流程。

如果这种闭环足够可靠并可扩展，就可能加速走向超级智能，并重塑实验室对自动化、人才和算力的思考方式。 Socher 表示，Recursive Superintelligence 的目标是让构思、实现和验证整个研究流程都自动化。文章也指出，现阶段这些尝试在实践中仍然比较有限：Karpathy 的 Auto-Research 主要只是在 GPT-2 规模模型上做出小幅改进，而更广义的 RSI 设想仍受可靠性和算力限制。

资讯正文

“递归”是 AI 圈里最新的流行词。已经有两家独立的初创公司采用了这个名字，还有更多公司开始在路线图中提到递归自我改进（RSI）。和此前的 AGI 一样，RSI 已经成了一个由三个字母组成的代称，指向一场足以颠覆一切的 AI 迅猛跃升——尽管关于它究竟意味着什么，仍然存在一点分歧。

从基本概念上说，RSI 指的是一种能够不断升级自身的 AI 系统。一旦 AI 系统在升级循环上的能力超过人类，这一过程就可能变成一个闭环，其唯一限制只是它们能够访问的算力；届时，人类就不再是必要的，甚至也算不上有帮助。

无论听起来可怕与否，这都是许多 AI 实验室都热衷追逐的愿景。

就在上个月早些时候，知名 AI 研究员 Richard Socher 推出了名为 Recursive Superintelligence 的公司，顾名思义，将 RSI 作为明确目标。Socher 在公司发布时对 TechCrunch 说：“我们的主要重点是构建真正递归、自我改进的超级智能，并将其规模化，”他说，“这意味着从研究想法的构思、实现到验证，整个过程都将自动化。”

另外一些知名研究人员也已经在追逐同样的目标，希望能取得突破，使递归自我改进成为可能。

其中最引人注目的一位是 Andrej Karpathy——这位来自 Tesla 和 OpenAI 的传奇人物——他正在使用智能体蜂群来训练 LLM 处理简单任务，为一个他称之为 Auto-Research 的项目服务。Karpathy 对这个项目异常开放，经常在推特上更新进展，并通过一个公开的 GitHub 仓库提供构建模块。到目前为止，这项工作主要还局限于在 GPT-2 规模的模型上做一些小幅改进——正如 Karpathy 今年 3 月所说，“它还不是新颖、突破性的‘研究’（至少现在还不是）”——但这已经足以说服许多其他研究人员追随 RSI 的梦想。而且，Karpathy 现在在 Anthropic 负责预训练，这让他有充足的机会把这一想法应用到更大规模上。

Adaption——由 Cohere 和 Google 的前员工 Sara Hooker 创立——最近推出了一个类似工具 AutoScientist，试图自动化前沿模型训练。和 Karpathy 的自动研究系统一样，这套系统训练智能体进行渐进式改进；但对 Adaption 而言，目标是让训练一个完整规模的前沿模型变得更容易。如果这些同样的研究人员开始推动前沿不断向前，这个系统很快就可能演变成非常像 RSI 的东西。

Disarray 的创始人 Doris Xin 则因为她自训练的机器学习智能体在最近一场 Kaggle 竞赛中拿下 28 枚奖牌、击败了许多人类训练的智能体，而引发了更具体的 RSI 关注。在她看来，最大的挑战是可靠性。

“如果给出无限算力和无限时间跨度，我会说我们其实已经到了，”Xin 对我说。“我想提出一个观点：这真的不是一种创造性的工作。它其实只是大量朴实无华的工程活。”

但还没到那一步。

同样有大量证据表明，AI 行业在任何有意义的层面上都还远未接近递归系统——而且它仍在努力向一个持怀疑态度的公众解释自己的进展。谷歌首席执行官 Sundar Pichai 在最近一次播客采访中基本上承认了这一点。

“这是一个连续谱，我们显然都在取得进展，”Pichai 说。“但按人们描述 RSI 的方式来看，那会代表一种更高层级的加速，而且会带来很多影响，但我们还没到那一步。”

不过，这个连续谱中已经包含了相当多自我改进的 AI 系统。今年 1 月，Anthropic 负责 Claude Code 的一位首席程序员估计，他团队“接近 100%”的代码都是由这个工具编写的——这坦率地表明，Claude Code 确实在“给自己写代码”。

工程师使用 AI 工具并不意味着该工具就能取代他们——但 Anthropic 似乎也已经接近取代工程师了。在与 Mythos 预览版相关的一项最新调查中，18 名 Anthropic 工程师里有 5 人认为，随着工具化能力的改进，这个版本的 Mythos 很快就可以替代一名 L4 工程师——也就是那种能够在没有监督的情况下承担复杂项目的中级程序员。

尽管如此，它仍然存在一些你可能预料到的相同弱点。

报告写道：“与 L4 相比，Claude 被报告的主要弱点包括：自我管理为期一周、目标模糊的任务；理解组织优先级、品味、验证、遵循指令，以及认识论。”

换句话说，它的弱点几乎就是与自我驱动有关的所有方面，而自我驱动正是 RSI 的基石。不过，当然，除此之外的其他事情，Claude 已经随时可以顶上。

和 AGI 这个词一样，AI 行业也无法告诉我们，距离展示一个有意义的递归系统还有多远。去年，乔治城大学安全与新兴技术中心（Center for Security and Emerging Technology，简称 CSET）召集一组专家研究 RSI，结果发现各方判断存在巨大分歧——有人预计会迅速出现类似“超级智能”的爆发，另一些人则认为进展会更慢，最终出现平台期。但大家都同意，递归会让未来尤其难以预测。

CSET 主任、前 OpenAI 董事会成员 Helen Toner 告诉 TechCrunch，仅仅使用 AI 工具来做 AI 研究，并不足以算作 RSI。“他们只是尽可能多地在使用 AI，”Toner 告诉 TechCrunch。“我认为这和 RSI 的经典定义是不同的，后者真正意味着不需要人类参与。”

Toner 指向了 METR 的 Ajeya Cotra 最近发布的一篇文章，其中区分了 AI 研究接管路径上的不同里程碑。Cotra 称为“适足性”（adequacy）的那一步，指的是即使把所有人类都移除，系统仍然能继续进行研究——即便最终产出的研究在价值或效率上不如人类参与时那么高。“平价”（parity）则是在 AI-only 系统的研究能力与纯人类系统一样强的时候出现。“优越”（supremacy）是最后阶段，指的是 AI-only 系统的表现超过人类与 AI 协作的系统。

最终，Cotra 得出的结论是，AI 已经非常接近“足够性”门槛——也就是能够独立产出一些工作成果——这与 Karpathy 的 Auto-Research 系统所做的渐进式改进类似。Cotra 写道：“如果你告诉我这个里程碑其实已经跨过去了，我也不会特别震惊；而且我预计它会在未来几年内发生。”

她对何时会达到“平价”则不太明确，不过一旦实现，她认为这将“极大加速 AI 进步的速度，并在之后一年内带来 AI 研究主导地位”。

前路障碍

由于 AI 很大程度上建立在规模定律之上，人们很容易强烈地认为 RSI 也会沿着同样的曲线发展。Toner 认为，许多通过 RSI 推进 AI 研究与开发的人“把它看作一架相当平滑的梯子，你只需要不断往上扩展就行”。

但即便 AI 研究人员能够像 Karpathy 的自动研究者那样做出渐进式改进，把整个研究流程交出去仍会面临更大的挑战。Toner 从计算史的角度来解释这一点：在这段历史中，人类把越来越多的流程交给机器，但仍然从上层进行指挥。

“我们从机器语言走到了汇编语言和编译语言；你离计算机的内部核心越来越远，”Toner 说，“但从某种直觉上讲，人类仍然在主导一切。”

要跨越这一范式，需要在工程和对齐两方面都克服重大挑战。不过，即便当前正在发生巨额投入，也不存在无限算力——而人类劳动与机器智能之间的基本权衡将很难被打破。

至于那种末日设想中的完全递归 AI 系统？研究人员基本达成一致的只有一点：和 AGI 一样，它还没有出现。

来源与参考

收录于 2026-05-29