RSI 成为 AI 领域新的 AGI 热词
TechCrunch AI··作者 Russell Brandom
关键信息
Socher 表示,Recursive Superintelligence 的目标是让构思、实现和验证整个研究流程都自动化。文章也指出,现阶段这些尝试在实践中仍然比较有限:Karpathy 的 Auto-Research 主要只是在 GPT-2 规模模型上做出小幅改进,而更广义的 RSI 设想仍受可靠性和算力限制。
资讯摘要
TechCrunch 报道称,递归自我改进(RSI)正在迅速成为 AI 圈里描述“系统能自我升级”的新流行词。文章重点提到 Richard Socher 创办的 Recursive Superintelligence,以及 Andrej Karpathy、Sara Hooker 等研究者正在推进的相关项目。 RSI 将长期围绕 AGI 的讨论,重新聚焦到一个更可操作的概念:AI 系统能否自己改进研究、训练和部署流程。
如果这种闭环足够可靠并可扩展,就可能加速走向超级智能,并重塑实验室对自动化、人才和算力的思考方式。 Socher 表示,Recursive Superintelligence 的目标是让构思、实现和验证整个研究流程都自动化。文章也指出,现阶段这些尝试在实践中仍然比较有限:Karpathy 的 Auto-Research 主要只是在 GPT-2 规模模型上做出小幅改进,而更广义的 RSI 设想仍受可靠性和算力限制。

资讯正文
“递归”是 AI 圈里最新的流行词。已经有两家独立的初创公司采用了这个名字,还有更多公司开始在路线图中提到递归自我改进(RSI)。和此前的 AGI 一样,RSI 已经成了一个由三个字母组成的代称,指向一场足以颠覆一切的 AI 迅猛跃升——尽管关于它究竟意味着什么,仍然存在一点分歧。
从基本概念上说,RSI 指的是一种能够不断升级自身的 AI 系统。一旦 AI 系统在升级循环上的能力超过人类,这一过程就可能变成一个闭环,其唯一限制只是它们能够访问的算力;届时,人类就不再是必要的,甚至也算不上有帮助。
无论听起来可怕与否,这都是许多 AI 实验室都热衷追逐的愿景。
就在上个月早些时候,知名 AI 研究员 Richard Socher 推出了名为 Recursive Superintelligence 的公司,顾名思义,将 RSI 作为明确目标。Socher 在公司发布时对 TechCrunch 说:“我们的主要重点是构建真正递归、自我改进的超级智能,并将其规模化,”他说,“这意味着从研究想法的构思、实现到验证,整个过程都将自动化。”
另外一些知名研究人员也已经在追逐同样的目标,希望能取得突破,使递归自我改进成为可能。
其中最引人注目的一位是 Andrej Karpathy——这位来自 Tesla 和 OpenAI 的传奇人物——他正在使用智能体蜂群来训练 LLM 处理简单任务,为一个他称之为 Auto-Research 的项目服务。Karpathy 对这个项目异常开放,经常在推特上更新进展,并通过一个公开的 GitHub 仓库提供构建模块。到目前为止,这项工作主要还局限于在 GPT-2 规模的模型上做一些小幅改进——正如 Karpathy 今年 3 月所说,“它还不是新颖、突破性的‘研究’(至少现在还不是)”——但这已经足以说服许多其他研究人员追随 RSI 的梦想。而且,Karpathy 现在在 Anthropic 负责预训练,这让他有充足的机会把这一想法应用到更大规模上。
Adaption——由 Cohere 和 Google 的前员工 Sara Hooker 创立——最近推出了一个类似工具 AutoScientist,试图自动化前沿模型训练。和 Karpathy 的自动研究系统一样,这套系统训练智能体进行渐进式改进;但对 Adaption 而言,目标是让训练一个完整规模的前沿模型变得更容易。如果这些同样的研究人员开始推动前沿不断向前,这个系统很快就可能演变成非常像 RSI 的东西。
Disarray 的创始人 Doris Xin 则因为她自训练的机器学习智能体在最近一场 Kaggle 竞赛中拿下 28 枚奖牌、击败了许多人类训练的智能体,而引发了更具体的 RSI 关注。在她看来,最大的挑战是可靠性。
“如果给出无限算力和无限时间跨度,我会说我们其实已经到了,”Xin 对我说。“我想提出一个观点:这真的不是一种创造性的工作。它其实只是大量朴实无华的工程活。”
但还没到那一步。
同样有大量证据表明,AI 行业在任何有意义的层面上都还远未接近递归系统——而且它仍在努力向一个持怀疑态度的公众解释自己的进展。谷歌首席执行官 Sundar Pichai 在最近一次播客采访中基本上承认了这一点。
“这是一个连续谱,我们显然都在取得进展,”Pichai 说。“但按人们描述 RSI 的方式来看,那会代表一种更高层级的加速,而且会带来很多影响,但我们还没到那一步。”
不过,这个连续谱中已经包含了相当多自我改进的 AI 系统。今年 1 月,Anthropic 负责 Claude Code 的一位首席程序员估计,他团队“接近 100%”的代码都是由这个工具编写的——这坦率地表明,Claude Code 确实在“给自己写代码”。
工程师使用 AI 工具并不意味着该工具就能取代他们——但 Anthropic 似乎也已经接近取代工程师了。在与 Mythos 预览版相关的一项最新调查中,18 名 Anthropic 工程师里有 5 人认为,随着工具化能力的改进,这个版本的 Mythos 很快就可以替代一名 L4 工程师——也就是那种能够在没有监督的情况下承担复杂项目的中级程序员。
尽管如此,它仍然存在一些你可能预料到的相同弱点。
报告写道:“与 L4 相比,Claude 被报告的主要弱点包括:自我管理为期一周、目标模糊的任务;理解组织优先级、品味、验证、遵循指令,以及认识论。”
换句话说,它的弱点几乎就是与自我驱动有关的所有方面,而自我驱动正是 RSI 的基石。不过,当然,除此之外的其他事情,Claude 已经随时可以顶上。
和 AGI 这个词一样,AI 行业也无法告诉我们,距离展示一个有意义的递归系统还有多远。去年,乔治城大学安全与新兴技术中心(Center for Security and Emerging Technology,简称 CSET)召集一组专家研究 RSI,结果发现各方判断存在巨大分歧——有人预计会迅速出现类似“超级智能”的爆发,另一些人则认为进展会更慢,最终出现平台期。但大家都同意,递归会让未来尤其难以预测。
CSET 主任、前 OpenAI 董事会成员 Helen Toner 告诉 TechCrunch,仅仅使用 AI 工具来做 AI 研究,并不足以算作 RSI。“他们只是尽可能多地在使用 AI,”Toner 告诉 TechCrunch。“我认为这和 RSI 的经典定义是不同的,后者真正意味着不需要人类参与。”
Toner 指向了 METR 的 Ajeya Cotra 最近发布的一篇文章,其中区分了 AI 研究接管路径上的不同里程碑。Cotra 称为“适足性”(adequacy)的那一步,指的是即使把所有人类都移除,系统仍然能继续进行研究——即便最终产出的研究在价值或效率上不如人类参与时那么高。“平价”(parity)则是在 AI-only 系统的研究能力与纯人类系统一样强的时候出现。“优越”(supremacy)是最后阶段,指的是 AI-only 系统的表现超过人类与 AI 协作的系统。
最终,Cotra 得出的结论是,AI 已经非常接近“足够性”门槛——也就是能够独立产出一些工作成果——这与 Karpathy 的 Auto-Research 系统所做的渐进式改进类似。Cotra 写道:“如果你告诉我这个里程碑其实已经跨过去了,我也不会特别震惊;而且我预计它会在未来几年内发生。”
她对何时会达到“平价”则不太明确,不过一旦实现,她认为这将“极大加速 AI 进步的速度,并在之后一年内带来 AI 研究主导地位”。
前路障碍
由于 AI 很大程度上建立在规模定律之上,人们很容易强烈地认为 RSI 也会沿着同样的曲线发展。Toner 认为,许多通过 RSI 推进 AI 研究与开发的人“把它看作一架相当平滑的梯子,你只需要不断往上扩展就行”。
但即便 AI 研究人员能够像 Karpathy 的自动研究者那样做出渐进式改进,把整个研究流程交出去仍会面临更大的挑战。Toner 从计算史的角度来解释这一点:在这段历史中,人类把越来越多的流程交给机器,但仍然从上层进行指挥。
“我们从机器语言走到了汇编语言和编译语言;你离计算机的内部核心越来越远,”Toner 说,“但从某种直觉上讲,人类仍然在主导一切。”
要跨越这一范式,需要在工程和对齐两方面都克服重大挑战。不过,即便当前正在发生巨额投入,也不存在无限算力——而人类劳动与机器智能之间的基本权衡将很难被打破。
至于那种末日设想中的完全递归 AI 系统?研究人员基本达成一致的只有一点:和 AGI 一样,它还没有出现。
来源与参考
收录于 2026-05-29