Mythos Preview 找到前沿模型遗漏的漏洞利用链
The Decoder··作者 Maximilian Schreiner
关键信息
Cloudflare 表示,更早的前沿模型通常也能找到相同的漏洞,但它们很难把这些漏洞拼接成完整的利用路径,往往还需要更多人工跟进。Mythos Preview 产生的推测性结论更少、复现步骤更清晰,并且更少依赖人工即可做出“修复或忽略”的判断,不过 Cloudflare 也强调,它仍然使用了最多 50 个并行代理和对抗式复核的多阶段框架。
资讯摘要
Cloudflare 表示,它将 Anthropic 的安全导向模型 Mythos Preview 纳入 Project Glasswing,在超过 50 个自有代码仓库中进行了测试。测试目标不是只看模型能否识别单个漏洞,而是看它能否把多个漏洞串联起来,形成完整的利用链。Cloudflare 首席安全官 Grant Bourzikas 说,更早的前沿模型虽然也能发现类似的单个漏洞,有时还会给出很好的分析,但它们往往无法把这些漏洞拼成一个真正可运行的漏洞利用,因此漏洞是否真正可被利用仍然不清楚。相比之下,Mythos Preview 更擅长把小的弱点组合成概念验证攻击,并且能够自己编写、编译和运行这些 PoC 代码。
Cloudflare 还表示,这个模型产生的推测性结果更少,复现步骤更清晰,因此在决定某个问题是需要修复还是可以忽略之前,所需的人工作业也更少。不过,Cloudflare 强调这并不是单个代理就能完成的工作,而是一个多阶段系统,最多同时运行 50 个代理,并加入对抗式复核,让第二个代理尝试推翻每一项发现。Cloudflare 也提醒,这种能力对防御者有价值,但对攻击者同样可能有用。

资讯正文
Cloudflare 表示,Anthropic 的 Mythos Preview 能够发现更早期前沿模型遗漏的利用链。
作为 Project Glasswing 的一部分,Cloudflare 在超过 50 个自有代码仓库上测试了 Anthropic 这款面向安全的 AI 模型 Mythos Preview。该模型能够将多个小漏洞串联成可运行的利用,并通过自行编写、编译和运行概念验证代码来证明这些漏洞确实存在。
Cloudflare 首席安全官 Grant Bourzikas 表示,较早的前沿模型也找到了类似的单个漏洞,有时还给出了扎实的分析。但它们在把这些碎片拼接起来方面表现不足,导致利用链没有完成,实际是否可被利用这一问题仍然悬而未决。Mythos Preview 产生的推测性发现更少,给出的复现步骤更清晰,而且在做出“修复”或“忽略”的决定之前,所需的人类跟进更少。
Cloudflare 强调,单个智能体并不够。公司构建了一个多阶段框架,最多可并行运行 50 个智能体,并加入对抗性审查,即由第二个智能体尝试推翻每一项发现。公司同时警告:这些能力也同样会落到攻击者手中。
来源与参考
收录于 2026-05-20