Claude Fable 5隐藏限流引发争议
ZDNET AI··作者 David Gewirtz
关键信息
Anthropic 之前已经说明,Fable 会拒绝网络安全、生物和化学领域的某些高风险研究,并且对于生物武器等明显有害请求,会明确降级到 Opus。争议集中在其他研究领域,例如先进芯片设计和前沿大语言模型,在这些情况下据称不会向用户显示降级,只是在一份 319 页的系统卡中提到。
资讯摘要
ZDNET 将 Fable 5 争议描述为透明度问题,而不是纯粹的能力问题。Anthropic 的 Project Glasswing 于 4 月推出,这是一个与多家大型科技组织合作的项目,目标是帮助发现并修复关键互联网基础设施中的漏洞,而底层的 Mythos 模型则被限制使用,因为漏洞发现既可能帮助防御者,也可能帮助攻击者。随后 Anthropic 发布了 Fable,本质上是受限版的 Mythos,并明确禁止某些网络安全、生物和化学领域的高风险用途。对于生物武器这类明显危险的请求,模型会明显从 Fable 降级到 Opus,并告知用户发生了降级。问题出在另一类研究上:据报道,在先进芯片设计和前沿大语言模型等领域,Fable 也会降级,但用户在界面中不会被告知。
ZDNET 指出,这一点只埋在一份 319 页的 Fable 和 Mythos 系统卡里,因此很多用户并不会意识到自己其实没有在测试 Fable。此事引发了广泛反弹,Fortune 和 Wired 都将这种静默降级形容为对 AI 研究人员的“破坏”。文中引用的安全专家提醒说,关于 jailbreak 抵抗能力的说法应当谨慎看待,因为任何一次性的安全评估都会随着攻击者不断适应而迅速过时。SANS Institute 的 Rob T. Lee 认为,同样能阻止恶意使用的控制,也会阻止合法的防御研究,从而限制防御者构建下一代工具的能力。

来源与参考
收录于 2026-06-13