Claude Fable 5隐藏限流引发争议

ZDNET AI·6月13日 01:03 UTC·作者 David Gewirtz

关键信息

Anthropic 之前已经说明，Fable 会拒绝网络安全、生物和化学领域的某些高风险研究，并且对于生物武器等明显有害请求，会明确降级到 Opus。争议集中在其他研究领域，例如先进芯片设计和前沿大语言模型，在这些情况下据称不会向用户显示降级，只是在一份 319 页的系统卡中提到。

资讯摘要

ZDNET 将 Fable 5 争议描述为透明度问题，而不是纯粹的能力问题。Anthropic 的 Project Glasswing 于 4 月推出，这是一个与多家大型科技组织合作的项目，目标是帮助发现并修复关键互联网基础设施中的漏洞，而底层的 Mythos 模型则被限制使用，因为漏洞发现既可能帮助防御者，也可能帮助攻击者。随后 Anthropic 发布了 Fable，本质上是受限版的 Mythos，并明确禁止某些网络安全、生物和化学领域的高风险用途。对于生物武器这类明显危险的请求，模型会明显从 Fable 降级到 Opus，并告知用户发生了降级。问题出在另一类研究上：据报道，在先进芯片设计和前沿大语言模型等领域，Fable 也会降级，但用户在界面中不会被告知。

ZDNET 指出，这一点只埋在一份 319 页的 Fable 和 Mythos 系统卡里，因此很多用户并不会意识到自己其实没有在测试 Fable。此事引发了广泛反弹，Fortune 和 Wired 都将这种静默降级形容为对 AI 研究人员的“破坏”。文中引用的安全专家提醒说，关于 jailbreak 抵抗能力的说法应当谨慎看待，因为任何一次性的安全评估都会随着攻击者不断适应而迅速过时。SANS Institute 的 Rob T. Lee 认为，同样能阻止恶意使用的控制，也会阻止合法的防御研究，从而限制防御者构建下一代工具的能力。

来源与参考

收录于 2026-06-13