Cloudflare在Project Glasswing中测试Mythos

Cloudflare AI··作者 Grant Bourzikas

关键信息

Cloudflare强调了Mythos Preview的两个突出能力:构建利用链和生成证明。文章还指出,即使没有像Opus 4.7或GPT-5.5这类公开模型中的额外安全护栏,该模型仍会不稳定地拒绝某些合法研究请求。

资讯摘要

Cloudflare表示,过去几个月一直在自家基础设施上测试多种面向安全的LLM,目的是一方面发现系统中的漏洞,另一方面了解攻击者在使用新模型时可能会做到什么程度。其中特别引人注意的是Anthropic的Mythos Preview,并被用于Project Glasswing。Cloudflare把该模型投入到五十多个代码仓库中,观察它能发现什么,以及它在实际工作中的表现。公司认为,Mythos Preview不是对早期前沿模型的简单改进,而是一种能够执行不同类型工作的全新工具。文章特别强调了两项能力:一是它能把多个小的攻击原语串联起来,推理出可执行的利用链;二是它能生成概念验证代码,在临时环境中编译并运行,然后根据失败结果继续调整。

Cloudflare指出,发现漏洞与证明漏洞可被利用并不是一回事,而Mythos Preview能够自己完成这一步。公司还说,其他前沿模型也找到了部分相同漏洞,推理能力有时甚至超出预期,但它们通常会停在中途,没有把各个片段真正拼成完整利用链。在Cloudflare看来,这意味着原本可能只会留在待办列表中的低严重性漏洞,如今可以被组合成更严重的攻击路径。文章最后还提到,Project Glasswing中的Mythos Preview版本没有公开版模型所具备的额外安全护栏,但它仍会对某些合法研究请求产生“自然拒绝”,而且这种拒绝并不稳定,同一任务换一种表述方式就可能得到完全不同的结果。

Cloudflare在Project Glasswing中测试Mythos

来源与参考

  1. 原始链接
  2. Project Glasswing: what Mythos showed us

收录于 2026-05-19