Claude Mythos Preview 找虫速度超过修补

The Decoder·5月23日 15:42 UTC·作者 Matthias Bastian

关键信息

Anthropic 没有披露具体技术细节，因为许多发现仍处在行业通行的 90 天披露窗口内，过早公开可能会让用户面临风险。公司称，独立评估显示该模型表现很强，包括在英国 AI Security Institute 的两个 cyber range 中全部通关，并在 ExploitBench 和 ExploitGym 上取得领先成绩，同时一些合作伙伴的补丁数量也明显上升。

资讯摘要

在 Project Glasswing 启动一个月后，Anthropic 公布了 Claude Mythos Preview 的首批结果。公司称，约 50 个合作伙伴在使用这款 AI 模型时，已经在与互联网和关键基础设施相关的软件中发现了超过 10,000 个高危或严重漏洞。Anthropic 表示，这个模型发现安全缺陷的速度已经超过了团队验证、披露和修补漏洞的速度。

Anthropic 将这一情况描述为一个危险的过渡期，因为 AI 驱动的漏洞发现正在快于组织的修复能力。公司还表示，由于行业通行的 90 天漏洞披露期仍然适用，因此目前不会公开某些技术细节，以免在修复完成前让用户暴露在风险之中。多家合作伙伴称，漏洞发现速度提升了十倍以上。

Cloudflare 表示，它标出了 2,000 个漏洞，其中 400 个属于高危或严重级别，而且该模型的误报率优于人工测试者。Mozilla 则表示，它在 Firefox 150 中发现并修复了 271 个漏洞，比 Claude Opus 4.6 在 Firefox 148 中发现的数量多出十倍以上。Anthropic 还援引英国 AI Security Institute 的外部评估结果称，最新的 Mythos Preview 检查点是首个完整解决其内部两个 cyber range 的模型。

独立安全平台 XBOW 认为，这一模型相比以往系统有重大进步，并称其具有“前所未有的精确度”。Anthropic 还表示，Mythos Preview 在学术基准 ExploitBench 和 ExploitGym 上也处于领先位置，而 GPT-5.5 在这些基准的大多数项目上紧随其后，并且已经公开可用。公司补充说，这种影响也已经反映在补丁发布量上，例如 Palo Alto Networks 在最新版本中发布的补丁数量是平时的五倍。

Anthropic 说，Microsoft 预计新的补丁数量在一段时间内还会继续上升，而 Oracle 则表示自己发现和修复漏洞的速度已经比以前快了好几倍。除了找漏洞之外，这个模型还有其他用途：Anthropic 称，它帮助某家合作银行识别并阻止了一笔价值超过 150 万美元的欺诈电汇。

与此同时，Anthropic 还用 Mythos Preview 扫描了 1,000 多个开源项目，并估计发现了 6,202 个高危或严重漏洞，以及 23,019 个各等级问题。在目前已由独立公司和 Anthropic 自身审查的 1,752 个高危或严重发现中，90.6% 被证实是真阳性，62.4% 被确认确实属于高危或严重。基于这些分流结果，Anthropic 估计该模型在开源代码中已经发现了接近 3,900 个已确认的高危或严重漏洞。

Anthropic 表示会继续扫描，但一些开源维护者要求公司放慢披露节奏，因为他们需要更多时间设计补丁。公司称，高危或严重漏洞平均需要两周才能修复，但目前已经报告了 530 个此类漏洞，其中 75 个已修补，65 个已发布公开公告，另有 827 个已确认漏洞仍在等待披露。

资讯正文

Anthropic 警告称，Claude Mythos Preview 发现漏洞的速度比开发者修补它们还要快

要点

- Anthropic 与大约 50 家合作伙伴使用 Claude Mythos Preview AI 模型，在短短一个月内就识别出超过 10,000 个与系统相关软件中的关键安全漏洞。

- 公司表示，漏洞发现的速度已经超过了验证和修复这些已识别缺陷的能力。

- Anthropic 警告称，当前正处于一个危险的过渡期，因为像 Claude Mythos 这样的 AI 模型能比组织打补丁快得多地发现漏洞，从而造成日益扩大的安全差距。

在启动 Project Glasswing 一个多月后，Anthropic 正在分享其首批结果。该公司表示，其 Claude Mythos Preview AI 模型与大约 50 家合作伙伴协作，在系统关键软件中找到了超过 10,000 个高危或严重级别漏洞。

Anthropic 在一篇博客文章中写道，如今该模型发现安全缺陷的速度已经快于团队验证、披露和修补这些问题的速度。公司没有公开具体技术细节，因为行业内披露新漏洞的标准期限是 90 天，而且在此之前，大多数发现都还不能描述，否则会让最终用户面临风险。

合作伙伴报告漏洞发现量增长十倍

Anthropic 表示，Glasswing 合作伙伴运行和开发的软件是互联网及其他关键基础设施的核心。每一家都发现了数百个严重漏洞。其中几家还表示，其漏洞发现速度提升了十倍以上。

Cloudflare 表示，它标记出了 2,000 个漏洞，其中 400 个为高危或严重级别。其误报率优于人工测试人员。Mozilla 在 Firefox 150 中发现并修复了 271 个漏洞，是其前代模型 Claude Opus 4.6 在 Firefox 148 中发现数量的十倍以上。

外部评审也印证了这些数字。英国 AI 安全研究所表示，最新的 Mythos Preview 检查点是首个完整解决其两个内部 cyber range 的模型——这两个环境模拟了多阶段网络攻击。独立安全平台 XBOW 称该模型相较此前所有模型都是一次重大进步，并提到其“前所未有的精确度”。Anthropic 还表示，Mythos Preview 在学术基准 ExploitBench 和 ExploitGym 上也名列前茅，而 GPT-5.5 在这些基准中的大多数上都很接近，而且已经公开可用。

Anthropic 表示，这种影响也体现在补丁数量上：Palo Alto Networks 在最新版本中发布的补丁数量是平时的五倍。Microsoft 说，新补丁的数量将“在一段时间内继续呈上升趋势”。Oracle 则声称，它发现和修复漏洞的速度比以前快了好几倍。

Mythos Preview 的作用也不只是寻找漏洞。Anthropic 说，在一家合作银行，该模型帮助发现并阻止了一笔超过 150 万美元的欺诈性电汇。

开源项目中发现超过 6,000 个潜在缺陷

除合作伙伴工作外，Anthropic 还表示，它使用 Mythos Preview 扫描了 1,000 多个开源项目。该模型估计发现了 6,202 个高危或严重级别漏洞，所有严重程度合计共有 23,019 项发现。

截至目前，独立安全公司——以及部分由 Anthropic 自身——已经审查了其中 1,752 项高危或严重级别的发现。90.6% 被证实是真阳性，62.4% 被确认确实属于高危或严重级别。基于这些分流（triage）比例，Anthropic 估计，Mythos Preview 已经在开源代码中发现了接近 3,900 个已确认的高危或严重漏洞。该公司计划继续扫描。

一些开源维护者已经要求 Anthropic 放慢披露速度，因为“他们需要更多时间来设计补丁”，博客文章称。平均而言，修复一个高危或严重级别漏洞需要两周时间。到目前为止，已有 530 个此类漏洞被报告给维护者。其中，75 个已经打上补丁，65 个发布了公开安全通告。另有 827 个已确认漏洞仍在等待披露。更糟糕的是，维护者们本就已经淹没在低质量、由 AI 生成的漏洞报告中。

Anthropic 警告高风险过渡期

Anthropic 表示，具备类似网络安全能力的模型很快就会被广泛提供。某些模型可能已经是如此。OpenAI 的 GPT-5.5 符合这一特征，此外还有一个更专门化的变体叫作 GPT-5.5 Cyber，不过这两者究竟有何具体区别尚不清楚。

无论如何，这些新能力都会带来一个过渡期：漏洞被发现得很快，但修补得却很慢。Anthropic 说，这一差距带来了新的风险。Mythos 级模型大幅缩短了发现和利用漏洞所需的时间与成本。没有任何公司，包括 Anthropic 在内，已经建立起足够强的防护措施来阻止滥用这些模型并防止严重损害。

从长远来看，这些模型应当能通过在代码发布前发现漏洞，帮助开发者构建安全得多的软件。目前，Anthropic 说软件团队应该缩短补丁周期，并尽可能让用户更容易进行更新。网络防御者则应坚持基本功：多因素认证、加固配置，以及全面日志记录。

来源与参考

收录于 2026-05-24