Anthropic泄露显示‘Claude Mythos’测试分数创纪录

The Decoder·3月28日 00:24 UTC·作者 Matthias Bastian

关键信息

该模型被描述为‘比Opus模型更大更智能’，Anthropic计划以谨慎的安全方式逐步发布，初期仅向一小部分客户开放，重点评估其网络安全能力。

资讯摘要

Anthropic的数据泄露事件暴露了内部文档，其中详细描述了一款名为‘Claude Mythos’（或‘Capybara’）的新AI模型，公司称这是迄今为止最强大的模型。它在编程、推理和网络安全基准测试中显著优于Claude Opus 4.6。此次泄露源于内容管理系统配置错误，导致近3000份内部文件可被公开访问。

Anthropic确认已开始对少数客户进行测试，并强调该模型在能力上实现了‘质的飞跃’。发布将采取渐进式策略，优先考虑安全性，因为该模型具备先进网络能力，可能超越当前防御体系。文档中出现了两个版本，一个叫‘Mythos’，另一个叫‘Capybara’，说明名称尚未最终确定。

资讯正文

Anthropic泄露揭示新型模型“Claude Mythos”，测试得分远超以往任何模型

更新——

- 增加了关于泄露模型文档的更多细节。

2026年3月27日更新：

据称泄露的博客文章已在线曝光；这些信息与《福布斯》后续报道内容一致。同一份博客文章存在两个版本，仅在模型名称上不同：“Mythos”（v1）和“Capybara”（v2）。Anthropic告诉《福布斯》，这些文档只是“正在考虑发表的早期草稿”，表明公司当时正为同一款模型在两个候选名称之间做决定。

在“Capybara”版本中，标题和正文中的名称已被替换，但副标题仍写着：“我们已完成训练一款新的AI模型：Claude Mythos。”两个版本均使用相同的命名理由，称该名称旨在唤起“连接知识与思想的深层纽带”。

根据草稿描述，这款模型属于Anthropic现有Opus系列之上的全新类别，被形容为“比我们的Opus模型更大、更智能——而Opus模型此前是我们最强大的模型”，其在软件编码、学术推理和网络安全等方面的测试得分“显著高于Claude Opus 4.6”。

当被问及评论时，Anthropic向《福布斯》确认正在训练和测试一款新模型。发言人表示：“我们正在开发一款通用模型，在推理、编码和网络安全方面有实质性进步。我们认为这是一款质的飞跃，也是我们迄今打造的最强大模型。”

Anthropic计划采取谨慎、注重安全的方式逐步发布该模型。

根据文档内容，Anthropic计划的发布节奏将明显慢于之前模型。该模型据称“目前在网络安全能力上远远领先于其他任何AI模型”，但也预示着“即将到来的一波模型将能够以远超防御者努力的速度利用漏洞”。发布初期将面向一小部分早期客户，他们将负责评估网络安全应用场景，随后通过Claude API逐步扩大访问权限。

草稿还承认，该模型对Anthropic来说“非常昂贵”，对客户而言也将“极其昂贵”。Anthropic表示正在努力提升效率，“在正式全面发布前使其更加高效”。该模型最终将以“Mythos”、“Capybara”还是其他名称面世，仍有待观察。

原始简短报道：

Anthropic的数据泄露事件暴露了一款尚未发布的AI模型详情，内部文件称这是该公司迄今为止最强大的模型。在《福布斯》首次披露后，Anthropic确认已开始向选定客户测试该模型，并声称它标志着推理、编码和网络安全能力的“质的飞跃”。此次泄露源于Anthropic内容管理系统配置错误：默认设置自动将上传文件设为公开，导致近3000份内部文档对任何人开放可见。

OpenAI也正准备发布一款重磅模型。该公司正在开发一款代号为“Spud”的新模型，目前已完成预训练。与Anthropic类似，OpenAI首席执行官山姆·阿尔特曼内部承诺该模型将带来显著的能力提升，称其能“真正加速经济”，尽管这句表述的具体含义尚不明确。两家公司都可能选择在下半年计划进行首次公开募股（IPO）前，适时推出各自最强的模型，以确保最佳市场定位。

AI新闻去 hype 版——由人类精选

作为THE DECODER的订阅用户，您将获得无广告阅读体验、每周AI通讯、独家《AI雷达》前沿报告（每年6期）、评论区访问权限以及完整档案库。

来源与参考

收录于 2026-03-28