Anthropic泄露显示‘Claude Mythos’测试分数创纪录

The Decoder··作者 Matthias Bastian

收录于 2026-03-28

Anthropic泄露显示‘Claude Mythos’测试分数创纪录

关键信息

该模型被描述为‘比Opus模型更大更智能’,Anthropic计划以谨慎的安全方式逐步发布,初期仅向一小部分客户开放,重点评估其网络安全能力。

资讯摘要

Anthropic的数据泄露事件暴露了内部文档,其中详细描述了一款名为‘Claude Mythos’(或‘Capybara’)的新AI模型,公司称这是迄今为止最强大的模型。它在编程、推理和网络安全基准测试中显著优于Claude Opus 4.6。此次泄露源于内容管理系统配置错误,导致近3000份内部文件可被公开访问。

Anthropic确认已开始对少数客户进行测试,并强调该模型在能力上实现了‘质的飞跃’。发布将采取渐进式策略,优先考虑安全性,因为该模型具备先进网络能力,可能超越当前防御体系。文档中出现了两个版本,一个叫‘Mythos’,另一个叫‘Capybara’,说明名称尚未最终确定。

资讯正文

The Decoder 更新时间:2026年3月28日 补充了关于泄露模型文档的更多细节。 更新时间:2026年3月27日 据称泄露的博客文章已在线出现;这些信息与《福布斯》后续报道中的内容一致。这两篇相同博客文章仅在模型名称上有所不同:一个是‘Mythos’(v1),另一个是‘Capybara’(v2)。Anthropic告诉《福布斯》,这些文件只是“正在考虑发布的早期内容草稿”,表明该公司当时正在为同一款模型选择两个候选名称。

在名为‘Capybara’的版本中,标题和正文中的名称全部替换为‘Capybara’,但副标题仍写着:“我们已完成训练一款新的AI模型:Claude Mythos。”两种版本都使用了相同的命名理由,即该名称旨在唤起“连接知识与思想之间深层纽带”的意象。

根据草稿描述,这款模型代表了Anthropic现有Opus系列之上的一个全新类别,被形容为“比我们的Opus模型更大、更智能——而Opus模型此前是我们最强大的模型”。它相较于Claude Opus 4.6,在软件编码、学术推理和网络安全等多个测试中取得了“显著更高的分数”。

当被问及评论时,Anthropic向《福布斯》确认正在训练和测试一款新模型。一位发言人表示:“我们正在开发一款通用模型,在推理、编码和网络安全方面有实质性进步。我们认为这是一个质的飞跃,也是我们迄今为止构建过的最强大的模型。”

Anthropic计划进行缓慢且注重安全的发布

根据文档内容,Anthropic计划比以往任何一款模型都更加谨慎地逐步推出这一新模型。该模型据称“目前在网络安全能力上远超其他任何AI模型”,但也预示着未来将出现一批能够以远超防御者应对速度的方式利用漏洞的新模型。发布初期将面向一小部分提前访问客户,他们负责评估网络安全应用,之后通过Claude API逐步扩大访问范围。

草稿还承认,该模型对Anthropic来说“服务成本非常高,对客户而言使用成本也将非常昂贵”。Anthropic表示正在努力提高其效率,“在正式发布前使其更加高效”。这款模型最终是否会以‘Mythos’、‘Capybara’或另一个名称面世,仍有待观察。

原始简报: Anthropic的数据泄露事件暴露了一款尚未发布的AI模型的详细信息,内部文件称这是该公司迄今最强大的模型。在《福布斯》率先报道此事后,Anthropic证实已开始向特定客户测试该模型,并声称这标志着推理、编码和网络安全能力的一次“重大跃进”。此次泄露源于Anthropic的内容管理系统配置错误:默认设置使上传文件自动公开,导致近3000份内部文档可供任何人查看。

标题:Anthropic泄露揭示新模型‘Claude Mythos’,在测试中得分显著高于以往任何模型

据报道,OpenAI也在为一次重大发布做准备。该公司正在开发一款代号为‘Spud’的新模型,该模型已经完成了预训练。与Anthropic类似,OpenAI首席执行官山姆·阿尔特曼内部承诺将实现能力的巨大飞跃,称该模型可以‘真正加速经济’——尽管这具体含义尚不明确。两家公司很可能都会选择在下半年计划的首次公开募股(IPO)前,适时发布各自最强的模型,以确保最佳市场定位。

AI新闻去 hype 版 —— 由人类精选

作为THE DECODER订阅者,您将获得无广告阅读体验、每周AI简报、独家‘AI雷达’前沿报告(每年6次)、评论区访问权限以及我们完整的档案库。

没有夸张的AI新闻 —— 由人类精选。

超过20%的首发折扣。

无干扰阅读 —— 无谷歌广告。

可访问评论区和社区讨论。

每周AI简报。

每年6次:‘AI雷达’—— 对关键AI话题的深度分析。

KI Pro线上活动最高享受25%折扣。

可访问我们完整的十年档案库。

获取来自The Decoder的最新AI资讯。

热门头条

Luma AI的Uni-1可能是首个真正挑战谷歌Nano Banana图像主导地位的对手

Anthropic泄露揭示新模型‘Claude Mythos’,在测试中得分显著高于以往任何模型

据报道,OpenAI CEO山姆·阿尔特曼内部透露了一款‘非常强大’的模型,声称它能‘真正加速经济’

OpenAI发布了一份提示指南,帮助设计师从GPT-5.4中获得更好的前端结果

Meta收购Dreamer团队全体成员,以加强其落后的AI代理雄心

别错过重要信息

了解AI动态,清晰有用,毫无冗余。

最受欢迎的内容

谷歌工程师表示,Claude Code在一小时内完成的工作,她的团队花了整整一年时间

勒昆在离开Meta创办自己的初创公司时说:‘你当然不会告诉像我这样的研究人员该做什么’

前OpenAI研究员表示当前AI模型无法从错误中学习,认为这是通往通用人工智能(AGI)的一大障碍

OpenClaw(原Clawdbot)和Moltbook让攻击者能轻松从正门进入系统

一项研究显示,一张打印标识就能劫持自动驾驶汽车并将其引向行人

据传GPT-5.4带来了百万token上下文窗口和极端推理模式

配图

Anthropic泄露显示‘Claude Mythos’测试分数创纪录

Tag

来源与参考

  1. 原始链接
  2. Anthropic leak reveals new model "Claude Mythos" with "dramatically higher scores on tests" than any previous model