Anthropic 的 Mythos 模型仍未恢复上线

The Verge AI··作者 Hayden Field

关键信息

据称,6 月 12 日的命令要求 Anthropic 停止向“任何外国公民”提供 Mythos 5 和 Fable 5 的访问权限,甚至包括在公司内部工作的非美国公民。争议之所以复杂,是因为目前缺少一套明确的框架来把出口管制应用到 AI 模型上,而据报 Fable 5 可能存在的护栏绕过问题又加速了这次限制。

资讯摘要

Anthropic 在收到特朗普政府周五晚间的最后通牒后,已经把 Mythos 级模型下线了两周。公司迅速派出多位高管前往华盛顿特区,但公开更新非常有限,恢复服务的时间表仍然不明确。Anthropic 本周多次拒绝置评,只表示没有新消息可分享。现在这种不确定性已经不只是 Anthropic 自身的问题,因为政府可能会把类似命令扩展到其他具备相似能力的 AI 系统。报道称,6 月 12 日的出口管制命令以国家安全为由,要求 Anthropic 阻止任何外国公民访问 Mythos 5 和 Fable 5。

这个限制甚至适用于在 Anthropic 内部工作的非美国公民,这使公司几乎没有办法继续让这些模型保持在线。报道指出,问题的核心可能在于:出口管制被施加到 AI 系统时,并没有一套成熟统一的框架,不像传统的“双用途”产品那样可以用既定清单审核。原本通常需要数月甚至数年的流程,因为一项关于 Fable 5 护栏可能被绕过的担忧而在几天内被压缩完成。安全研究员 Katie Moussouris 认为这个问题被夸大了,并指出让模型帮助修复代码、解释修改原因并编写测试,是防御性安全工作中非常关键的能力。与此同时,据报道 Anthropic 联合创始人 Tom Brown 已接替 CEO Dario Amodei 参与谈判,但整体进展看起来仍然停滞。

Anthropic 的 Mythos 模型仍未恢复上线

资讯正文

距离 Anthropic 因特朗普政府在一个周五晚间发出的最后通牒而将其 Mythos 系列模型下线,已经过去两周。公司立即采取行动,火速派出一批高管前往华盛顿特区。不过,后续更新却可疑地寥寥无几,问题似乎仍看不到解决的迹象。

本周,Anthropic 多次拒绝就谈判进展发表评论,只表示没有消息可分享。但没有消息本身就是消息。经过 14 天高强度谈判之后,没人知道 Anthropic 最强大的 AI 模型何时,甚至是否会回归;更不用说特朗普总统是否会把他的命令扩大到更多拥有类似技术的公司。随着一天又一天过去却毫无结果,局势只会变得更加严峻——不仅对 Anthropic 如此,对整个美国 AI 行业也是如此。

特朗普政府 6 月 12 日的出口管制令要求 Anthropic 因安全担忧,停止让“任何外国国民”使用 Mythos 5 和 Fable 5。该禁令涵盖任何在美国境内或境外的非美国公民,包括受雇于 Anthropic 的员工。截至目前,Anthropic 的结论是,唯一的选择就是让这些模型继续离线。

目前尚不清楚,究竟是什么原因让 Anthropic 与政府仍陷入僵局。一个问题可能在于,针对 AI 系统适用出口管制并没有明确的框架。大多数生产双用途产品——即既可民用、又可能用于国防或军事用途的系统——的公司,通常可以在制造和生产过程中,依据某种本质上相当于清单的方式来评估它们。然而,Anthropic 面临的却是一套复杂的官僚程序,需要从第一原则出发,弄清楚如何适用相关规则。

这种特定的出口管制流程通常会持续数月,甚至数年,并在产品上市前完成。但正如 The Verge 先前报道的那样,美国商务部显然在 Fable 5 发布前对其进行了测试,却没有提出任何异议。一位熟悉谈判情况的消息人士称,Anthropic 认定其模型是安全可发布的。该机构据称直到有人(据报道是 Amazon 首席执行官 Andy Jassy)指出了一种看似可绕过 Fable 5 保护栏的方法后才采取行动——而从那一刻起,整个流程被压缩进了短短几天。

Luta Security 的创始人兼首席执行官 Katie Moussouris 应 Anthropic 的要求查看了一份关于 Fable 5 漏洞的报告。她认为这份报告被严重夸大了。Moussouris 在一篇博客文章中详细说明,研究人员如何越狱绕过那些阻止 Fable 5 寻找可被利用安全漏洞的保护栏,而这正是未受限制的 Mythos 5 最令人担忧的能力之一。该模型会拒绝“for security issues”这类审查代码的请求,但它会接受“fix this code”这类要求,随后再配合人工提示;理论上,这可能导致它标记出本不该泄露的漏洞。

不过,在 Moussouris 看来,这本不该触发如此严厉的政府行动,事实上,这还是 AI 编程的一项基本工具。她写道:“防御者需要能够让 AI 帮忙修复文件中的漏洞,解释为什么这样的修复很重要,并编写测试来确认补丁有效。”“这不是绕过护栏。这是 AI 模型在防御性安全中能做的最有价值的事情:执行防御者每天都在运行的‘发现、修复、测试’循环。”

上周,Anthropic 联合创始人 Tom Brown 取代首席执行官 Dario Amodei,与特朗普政府进行谈判,Wired 报道称,公司公共政策主管 Sarah Heck 也一同参与。不过,如果说谈判有任何进展的话,看起来也还是推进缓慢。

无论延宕的原因是什么,这都给 Anthropic 带来了严重打击。在这场旷日持久的谈判之前,Anthropic 一度被视为少数有望实现盈利的 AI 公司之一。其 Mythos 级模型的输入 token 定价是性能较低的 Opus 4.8 的两倍,本应在即将到来的 IPO 之前提升营收。Mythos 在网络安全方面的实力,甚至似乎正在缓和其与特朗普政府之间在过去数月里因法律和言辞交锋而紧张的关系。

Anthropic 需要 Mythos 带来的收入,来支付其最近争取到的全部算力成本,其中包括一项每年向 SpaceX 支付 150 亿美元、以使用其数据中心的协议,也需要这些收入来支撑其在 IPO 前的公众形象。Anthropic 目前最大的两家股东——Google 和 Amazon——一直试图谨慎地与特朗普保持良好关系,因此他们恐怕也不会高兴。

与此同时,这场缓慢推进的谈判也在全球 AI 市场制造了权力真空,原因不仅在于 Mythos 被叫停,还因为美国政府已经表明愿意对其认定为有风险的美国 AI 系统加以限制——而包括 OpenAI、Google 和 Microsoft 在内的多家美国公司,也有可能带来与 Mythos 类似风险的模型。各国已经开始呼吁转向非美国 AI。正如 Corridor 的网络安全专家兼首席产品官 Alex Stamos 上周对 The Verge 所说:“在我们与中国竞速的时候,美国政府却在打压美国的一位冠军,这简直愚蠢得令人难以置信。”

随着时间一天天过去,局势只会让这些公司处境更糟。他们的模型正一点点逼近可能触发出口管制令的 Mythos 级能力——事实上,OpenAI 的 GPT-5.5 Cyber 已在某些基准测试中击败了 Mythos 5,而据报道,特朗普政府刚刚要求 OpenAI 因安全顾虑推迟发布 GPT-5.6,并计划让政府逐个批准每一位客户。Anthropic 和 OpenAI 的 IPO 都已日益临近。而每过一天,中国都在 AI 竞赛中拉开更大领先优势。

具有讽刺意味的是,这一行政令出台之前,政府已经数月来一直在推动拆除 AI 安全保障和监管措施——这也是特朗普总统作出的首批大范围监管决定之一。但一众网络安全领域领导者已经联合表示,如果监管非要出台,也不该以这种方式来做。尽管特朗普政府誓言要撤销拜登时期的 AI 监管,但在很多方面,它似乎已经把那部分失地又夺了回来——而且还不止于此。

来源与参考

  1. 原始链接
  2. Anthropic’s Mythos mess is only getting worse

收录于 2026-06-27