Mythos Preview 找到前沿模型遗漏的漏洞利用链

The Decoder·5月19日 19:13 UTC·作者 Maximilian Schreiner

关键信息

Cloudflare 表示，更早的前沿模型通常也能找到相同的漏洞，但它们很难把这些漏洞拼接成完整的利用路径，往往还需要更多人工跟进。Mythos Preview 产生的推测性结论更少、复现步骤更清晰，并且更少依赖人工即可做出“修复或忽略”的判断，不过 Cloudflare 也强调，它仍然使用了最多 50 个并行代理和对抗式复核的多阶段框架。

资讯摘要

Cloudflare 表示，它将 Anthropic 的安全导向模型 Mythos Preview 纳入 Project Glasswing，在超过 50 个自有代码仓库中进行了测试。测试目标不是只看模型能否识别单个漏洞，而是看它能否把多个漏洞串联起来，形成完整的利用链。Cloudflare 首席安全官 Grant Bourzikas 说，更早的前沿模型虽然也能发现类似的单个漏洞，有时还会给出很好的分析，但它们往往无法把这些漏洞拼成一个真正可运行的漏洞利用，因此漏洞是否真正可被利用仍然不清楚。相比之下，Mythos Preview 更擅长把小的弱点组合成概念验证攻击，并且能够自己编写、编译和运行这些 PoC 代码。

Cloudflare 还表示，这个模型产生的推测性结果更少，复现步骤更清晰，因此在决定某个问题是需要修复还是可以忽略之前，所需的人工作业也更少。不过，Cloudflare 强调这并不是单个代理就能完成的工作，而是一个多阶段系统，最多同时运行 50 个代理，并加入对抗式复核，让第二个代理尝试推翻每一项发现。Cloudflare 也提醒，这种能力对防御者有价值，但对攻击者同样可能有用。

资讯正文

Cloudflare 表示，Anthropic 的 Mythos Preview 能够发现更早期前沿模型遗漏的利用链。

作为 Project Glasswing 的一部分，Cloudflare 在超过 50 个自有代码仓库上测试了 Anthropic 这款面向安全的 AI 模型 Mythos Preview。该模型能够将多个小漏洞串联成可运行的利用，并通过自行编写、编译和运行概念验证代码来证明这些漏洞确实存在。

Cloudflare 首席安全官 Grant Bourzikas 表示，较早的前沿模型也找到了类似的单个漏洞，有时还给出了扎实的分析。但它们在把这些碎片拼接起来方面表现不足，导致利用链没有完成，实际是否可被利用这一问题仍然悬而未决。Mythos Preview 产生的推测性发现更少，给出的复现步骤更清晰，而且在做出“修复”或“忽略”的决定之前，所需的人类跟进更少。

Cloudflare 强调，单个智能体并不够。公司构建了一个多阶段框架，最多可并行运行 50 个智能体，并加入对抗性审查，即由第二个智能体尝试推翻每一项发现。公司同时警告：这些能力也同样会落到攻击者手中。

来源与参考

收录于 2026-05-20