英国AI安全研究所评估GPT-5.5的网络安全能力

Simon Willison··作者 Simon Willison

关键信息

与Claude Mythos的受限预览版不同,GPT-5.5目前已普遍可用,使其成为组织需要防范AI辅助攻击时更紧迫的关注点。

资讯摘要

英国AI安全研究所最近发布了一份关于OpenAI GPT-5.5网络安全能力的评估报告,重点考察其识别软件漏洞的能力。报告指出,GPT-5.5的表现与Anthropic的Claude Mythos相当,后者曾被证明能检测到数千个操作系统和浏览器中的零日漏洞。然而,与Claude Mythos最初仅限于受限预览版本不同,GPT-5.5目前已对开发者和组织广泛开放。

这种可用性增加了网络安全团队必须理解并应对AI辅助攻击风险的紧迫感。研究结果表明,前沿大语言模型现在能够显著加速漏洞发现,这对红队和防御方都有影响。该机构的对比为未来基于AI的安全工具提供了宝贵的基准。

资讯正文

英国人工智能安全研究所此前评估了Claude Mythos的网络能力:现在他们又对GPT-5.5进行了评估,发现它在发现安全漏洞方面与Mythos相当,但与Mythos不同的是,GPT-5.5目前通常可获得。

标签:ai、openai、generative-ai、llms、anthropic、claude、ai-security-research、gpt

来源与参考

  1. 原始链接
  2. Our evaluation of OpenAI’s GPT-5.5 cyber capabilities

收录于 2026-05-02