Anthropic泄露显示‘Claude Mythos’测试分数创纪录

The Decoder··作者 Matthias Bastian

关键信息

该模型被描述为‘比Opus模型更大更智能’,Anthropic计划以谨慎的安全方式逐步发布,初期仅向一小部分客户开放,重点评估其网络安全能力。

资讯摘要

Anthropic的数据泄露事件暴露了内部文档,其中详细描述了一款名为‘Claude Mythos’(或‘Capybara’)的新AI模型,公司称这是迄今为止最强大的模型。它在编程、推理和网络安全基准测试中显著优于Claude Opus 4.6。此次泄露源于内容管理系统配置错误,导致近3000份内部文件可被公开访问。

Anthropic确认已开始对少数客户进行测试,并强调该模型在能力上实现了‘质的飞跃’。发布将采取渐进式策略,优先考虑安全性,因为该模型具备先进网络能力,可能超越当前防御体系。文档中出现了两个版本,一个叫‘Mythos’,另一个叫‘Capybara’,说明名称尚未最终确定。

Anthropic泄露显示‘Claude Mythos’测试分数创纪录

资讯正文

Anthropic泄露揭示新型模型“Claude Mythos”,测试得分远超以往任何模型

更新——

- 增加了关于泄露模型文档的更多细节。

2026年3月27日更新:

据称泄露的博客文章已在线曝光;这些信息与《福布斯》后续报道内容一致。同一份博客文章存在两个版本,仅在模型名称上不同:“Mythos”(v1)和“Capybara”(v2)。Anthropic告诉《福布斯》,这些文档只是“正在考虑发表的早期草稿”,表明公司当时正为同一款模型在两个候选名称之间做决定。

在“Capybara”版本中,标题和正文中的名称已被替换,但副标题仍写着:“我们已完成训练一款新的AI模型:Claude Mythos。”两个版本均使用相同的命名理由,称该名称旨在唤起“连接知识与思想的深层纽带”。

根据草稿描述,这款模型属于Anthropic现有Opus系列之上的全新类别,被形容为“比我们的Opus模型更大、更智能——而Opus模型此前是我们最强大的模型”,其在软件编码、学术推理和网络安全等方面的测试得分“显著高于Claude Opus 4.6”。

当被问及评论时,Anthropic向《福布斯》确认正在训练和测试一款新模型。发言人表示:“我们正在开发一款通用模型,在推理、编码和网络安全方面有实质性进步。我们认为这是一款质的飞跃,也是我们迄今打造的最强大模型。”

Anthropic计划采取谨慎、注重安全的方式逐步发布该模型。

根据文档内容,Anthropic计划的发布节奏将明显慢于之前模型。该模型据称“目前在网络安全能力上远远领先于其他任何AI模型”,但也预示着“即将到来的一波模型将能够以远超防御者努力的速度利用漏洞”。发布初期将面向一小部分早期客户,他们将负责评估网络安全应用场景,随后通过Claude API逐步扩大访问权限。

草稿还承认,该模型对Anthropic来说“非常昂贵”,对客户而言也将“极其昂贵”。Anthropic表示正在努力提升效率,“在正式全面发布前使其更加高效”。该模型最终将以“Mythos”、“Capybara”还是其他名称面世,仍有待观察。

原始简短报道:

Anthropic的数据泄露事件暴露了一款尚未发布的AI模型详情,内部文件称这是该公司迄今为止最强大的模型。在《福布斯》首次披露后,Anthropic确认已开始向选定客户测试该模型,并声称它标志着推理、编码和网络安全能力的“质的飞跃”。此次泄露源于Anthropic内容管理系统配置错误:默认设置自动将上传文件设为公开,导致近3000份内部文档对任何人开放可见。

OpenAI也正准备发布一款重磅模型。该公司正在开发一款代号为“Spud”的新模型,目前已完成预训练。与Anthropic类似,OpenAI首席执行官山姆·阿尔特曼内部承诺该模型将带来显著的能力提升,称其能“真正加速经济”,尽管这句表述的具体含义尚不明确。两家公司都可能选择在下半年计划进行首次公开募股(IPO)前,适时推出各自最强的模型,以确保最佳市场定位。

AI新闻去 hype 版——由人类精选

作为THE DECODER的订阅用户,您将获得无广告阅读体验、每周AI通讯、独家《AI雷达》前沿报告(每年6期)、评论区访问权限以及完整档案库。

来源与参考

  1. 原始链接
  2. Anthropic leak reveals new model "Claude Mythos" with "dramatically higher scores on tests" than any previous model

收录于 2026-03-28