Karpathy 加入 Anthropic 投身前沿 LLM 研究

The Decoder··作者 Matthias Bastian

关键信息

Anthropic 的预训练团队负责大型 AI 模型的初始训练阶段,目标是在后续微调之前先构建尽可能强的基础模型。文章称 Karpathy 将组建自己的预训练团队,并利用 Claude 加速预训练研究,但除此之外没有提供更多技术细节。

资讯摘要

知名 AI 研究者 Andrej Karpathy 将加入 Anthropic,此前他曾在 OpenAI 和 Tesla 工作。Karpathy 在 X 上表示,他很高兴重新回到研究与开发工作,并认为未来几年处在大语言模型前沿的阶段“尤其具有塑造性”。文章称,他将加入 Anthropic 的预训练团队,该团队负责大型 AI 模型训练的第一阶段。这个阶段的目标,是先构建尽可能强的基础模型,之后再通过强化学习等方法针对推理、编程或数学等任务进行微调。

文章还援引 Axios 称,Karpathy 将组建自己的预训练团队,并利用 Claude 来加速预训练研究。报道认为,这对 OpenAI 来说是一次明显的人才流失,因为 Karpathy 曾是其早期核心团队成员,之后又回到 OpenAI,直到 2024 年最终离开。他最近主要在通过创业公司 Eureka Labs 关注 AI 教育,并表示未来合适的时候仍会重新投入这项工作。文章最后强调,他选择 Anthropic 也反映出顶级 AI 实验室之间争夺前沿研究人才的竞争非常激烈。

Karpathy 加入 Anthropic 投身前沿 LLM 研究

资讯正文

知名 AI 研究员 Andrej Karpathy 选择加入 Anthropic,而不是回到他曾任职的 OpenAI,以重返前沿 LLM 研究。

更新:

Karpathy 将加入 Anthropic 的预训练团队,也就是负责大型 AI 模型初始训练的团队。这项工作是构建尽可能强大的基础模型,随后再通过强化学习等方法针对推理、编码或数学等具体任务进行微调。

据 Axios 报道,Karpathy 将组建自己的预训练团队,重点利用 Claude 来加速预训练研究。AI 研究中的一个关键押注,以及“AI 进步可以呈指数级复利增长”这一想法,都取决于模型能够帮助改进它们自己。

原始文章:

知名 AI 研究员 Andrej Karpathy 将加入 Anthropic。他在 X 上发文称,自己很兴奋能重新投入研究和开发,并把未来几年在大型语言模型前沿的工作称为“尤其具有塑造性”。Karpathy 最近表示,在几个月前还否定智能体能力的情况下,他对用于编码的智能体 AI 进展感到震撼。

最近,Karpathy 一直通过自己的初创公司 Eureka Labs 从事 AI 教育相关工作。他说,这一主题对他仍然意义重大,并计划在时机成熟时重新开展这项工作。

Karpathy 是 AI 圈内最知名的人物之一。他曾在 OpenAI 早期核心团队中工作,并担任关键研究员。之后,他帮助打造了特斯拉的 Autopilot 和 Full Self-Driving 技术,随后回到 OpenAI,并最终于 2024 年彻底离开。如今他选择加入 Anthropic,而不是回到 OpenAI,这对他的前东家来说似乎是一个明显的损失。

来源与参考

  1. 原始链接
  2. Prominent AI researcher Andrej Karpathy picks Anthropic over former home OpenAI to get back into frontier LLM research

收录于 2026-05-20