Cloudflare在Project Glasswing中测试Mythos

Cloudflare AI·5月18日 14:00 UTC·作者 Grant Bourzikas

关键信息

Cloudflare强调了Mythos Preview的两个突出能力：构建利用链和生成证明。文章还指出，即使没有像Opus 4.7或GPT-5.5这类公开模型中的额外安全护栏，该模型仍会不稳定地拒绝某些合法研究请求。

资讯摘要

Cloudflare表示，过去几个月一直在自家基础设施上测试多种面向安全的LLM，目的是一方面发现系统中的漏洞，另一方面了解攻击者在使用新模型时可能会做到什么程度。其中特别引人注意的是Anthropic的Mythos Preview，并被用于Project Glasswing。Cloudflare把该模型投入到五十多个代码仓库中，观察它能发现什么，以及它在实际工作中的表现。公司认为，Mythos Preview不是对早期前沿模型的简单改进，而是一种能够执行不同类型工作的全新工具。文章特别强调了两项能力：一是它能把多个小的攻击原语串联起来，推理出可执行的利用链；二是它能生成概念验证代码，在临时环境中编译并运行，然后根据失败结果继续调整。

Cloudflare指出，发现漏洞与证明漏洞可被利用并不是一回事，而Mythos Preview能够自己完成这一步。公司还说，其他前沿模型也找到了部分相同漏洞，推理能力有时甚至超出预期，但它们通常会停在中途，没有把各个片段真正拼成完整利用链。在Cloudflare看来，这意味着原本可能只会留在待办列表中的低严重性漏洞，如今可以被组合成更严重的攻击路径。文章最后还提到，Project Glasswing中的Mythos Preview版本没有公开版模型所具备的额外安全护栏，但它仍会对某些合法研究请求产生“自然拒绝”，而且这种拒绝并不稳定，同一任务换一种表述方式就可能得到完全不同的结果。

来源与参考

收录于 2026-05-19