Claude Mythos Preview 找漏洞快过修补

The Decoder··作者 Matthias Bastian

关键信息

Anthropic 表示,受行业常见的 90 天漏洞披露窗口限制,许多发现目前还不能公开详细说明,否则可能危及用户安全。公司还称其筛选质量较高:目前已审核的 1,752 个高危或严重发现中,90.6% 为真正阳性,62.4% 被确认确实属于高危或严重漏洞。

资讯摘要

在推出 Project Glasswing 一个多月后,Anthropic 公布了 Claude Mythos Preview 与约 50 个合作伙伴的首批结果。公司称,该模型在支撑互联网和其他关键基础设施的软件中发现了 1 万多个高危或严重漏洞。Anthropic 说,漏洞发现速度已经快于团队验证、披露和修补这些问题的速度。由于大多数发现仍处于行业通行的 90 天披露窗口内,公司暂时没有公开具体技术细节。合作伙伴报告了明显的效率提升,部分场景中的漏洞发现率提高了十倍以上。

Cloudflare 表示它找到了 2,000 个漏洞,其中 400 个属于高危或严重级别,而且模型的误报率优于人工测试人员。Mozilla 说,它在 Firefox 150 中发现并修复了 271 个漏洞,是 Claude Opus 4.6 在 Firefox 148 中发现数量的十倍以上。Anthropic 还表示,英国 AI Security Institute 和安全平台 XBOW 等外部评估支持这些结果。公司称,Mythos Preview 已经开始影响 Palo Alto Networks、Microsoft 和 Oracle 等厂商的补丁发布节奏,而且还帮助某家合作银行拦截了一笔超过 150 万美元的欺诈性电汇。

Claude Mythos Preview 找漏洞快过修补

资讯正文

Anthropic 警告称,Claude Mythos Preview 发现漏洞的速度比开发者修补它们还要快

要点

- Anthropic 与大约 50 家合作伙伴使用 Claude Mythos Preview AI 模型,在短短一个月内就识别出超过 10,000 个与系统相关软件中的关键安全漏洞。

- 公司表示,漏洞发现的速度已经超过了验证和修复这些已识别缺陷的能力。

- Anthropic 警告称,当前正处于一个危险的过渡期,因为像 Claude Mythos 这样的 AI 模型能比组织打补丁快得多地发现漏洞,从而造成日益扩大的安全差距。

在启动 Project Glasswing 一个多月后,Anthropic 正在分享其首批结果。该公司表示,其 Claude Mythos Preview AI 模型与大约 50 家合作伙伴协作,在系统关键软件中找到了超过 10,000 个高危或严重级别漏洞。

Anthropic 在一篇博客文章中写道,如今该模型发现安全缺陷的速度已经快于团队验证、披露和修补这些问题的速度。公司没有公开具体技术细节,因为行业内披露新漏洞的标准期限是 90 天,而且在此之前,大多数发现都还不能描述,否则会让最终用户面临风险。

合作伙伴报告漏洞发现量增长十倍

Anthropic 表示,Glasswing 合作伙伴运行和开发的软件是互联网及其他关键基础设施的核心。每一家都发现了数百个严重漏洞。其中几家还表示,其漏洞发现速度提升了十倍以上。

Cloudflare 表示,它标记出了 2,000 个漏洞,其中 400 个为高危或严重级别。其误报率优于人工测试人员。Mozilla 在 Firefox 150 中发现并修复了 271 个漏洞,是其前代模型 Claude Opus 4.6 在 Firefox 148 中发现数量的十倍以上。

外部评审也印证了这些数字。英国 AI 安全研究所表示,最新的 Mythos Preview 检查点是首个完整解决其两个内部 cyber range 的模型——这两个环境模拟了多阶段网络攻击。独立安全平台 XBOW 称该模型相较此前所有模型都是一次重大进步,并提到其“前所未有的精确度”。Anthropic 还表示,Mythos Preview 在学术基准 ExploitBench 和 ExploitGym 上也名列前茅,而 GPT-5.5 在这些基准中的大多数上都很接近,而且已经公开可用。

Anthropic 表示,这种影响也体现在补丁数量上:Palo Alto Networks 在最新版本中发布的补丁数量是平时的五倍。Microsoft 说,新补丁的数量将“在一段时间内继续呈上升趋势”。Oracle 则声称,它发现和修复漏洞的速度比以前快了好几倍。

Mythos Preview 的作用也不只是寻找漏洞。Anthropic 说,在一家合作银行,该模型帮助发现并阻止了一笔超过 150 万美元的欺诈性电汇。

开源项目中发现超过 6,000 个潜在缺陷

除合作伙伴工作外,Anthropic 还表示,它使用 Mythos Preview 扫描了 1,000 多个开源项目。该模型估计发现了 6,202 个高危或严重级别漏洞,所有严重程度合计共有 23,019 项发现。

截至目前,独立安全公司——以及部分由 Anthropic 自身——已经审查了其中 1,752 项高危或严重级别的发现。90.6% 被证实是真阳性,62.4% 被确认确实属于高危或严重级别。基于这些分流(triage)比例,Anthropic 估计,Mythos Preview 已经在开源代码中发现了接近 3,900 个已确认的高危或严重漏洞。该公司计划继续扫描。

一些开源维护者已经要求 Anthropic 放慢披露速度,因为“他们需要更多时间来设计补丁”,博客文章称。平均而言,修复一个高危或严重级别漏洞需要两周时间。到目前为止,已有 530 个此类漏洞被报告给维护者。其中,75 个已经打上补丁,65 个发布了公开安全通告。另有 827 个已确认漏洞仍在等待披露。更糟糕的是,维护者们本就已经淹没在低质量、由 AI 生成的漏洞报告中。

Anthropic 警告高风险过渡期

Anthropic 表示,具备类似网络安全能力的模型很快就会被广泛提供。某些模型可能已经是如此。OpenAI 的 GPT-5.5 符合这一特征,此外还有一个更专门化的变体叫作 GPT-5.5 Cyber,不过这两者究竟有何具体区别尚不清楚。

无论如何,这些新能力都会带来一个过渡期:漏洞被发现得很快,但修补得却很慢。Anthropic 说,这一差距带来了新的风险。Mythos 级模型大幅缩短了发现和利用漏洞所需的时间与成本。没有任何公司,包括 Anthropic 在内,已经建立起足够强的防护措施来阻止滥用这些模型并防止严重损害。

从长远来看,这些模型应当能通过在代码发布前发现漏洞,帮助开发者构建安全得多的软件。目前,Anthropic 说软件团队应该缩短补丁周期,并尽可能让用户更容易进行更新。网络防御者则应坚持基本功:多因素认证、加固配置,以及全面日志记录。

来源与参考

  1. 原始链接
  2. Anthropic warns Claude Mythos Preview finds bugs faster than developers can patch them