OpenAI 向审核安全研究者开放 GPT-5.5-Cyber

The Decoder··作者 Maximilian Schreiner

关键信息

OpenAI 表示,这次开放采用分层机制:公众模型保持标准限制,中间层为防御性工作放宽过滤,而 GPT-5.5-Cyber 则为授权测试提供最少限制。OpenAI 还表示,该模型仍会阻止窃取密码或攻击第三方系统等明显有害请求,并且从 2026 年 6 月 1 日起,最高权限层的个人用户必须启用抗钓鱼身份验证。

资讯摘要

OpenAI 已向安全研究人员开放 GPT-5.5,并推出了一个专门面向网络安全的变体 GPT-5.5-Cyber。这个模型比公开版聊天机器人更少拒绝请求,因此更适合用于防御性安全工作。报道指出,此次开放并不是完全无门槛,而是采用分层机制:从标准公众模型,到过滤更宽松的中间层,再到限制最少的 GPT-5.5-Cyber。当前权限最高、限制最少的版本,只向通过 OpenAI “Trusted Access for Cyber” 计划审核、负责保护关键基础设施的防御者开放。

OpenAI 表示,该模型可以用于渗透测试、恶意软件分析和安全补丁审查等任务。与此同时,OpenAI 也强调它仍会阻止明显有害的请求,比如窃取密码或攻击第三方系统。报道中的演示显示,限制放宽的程度非常明显:公众模型会拒绝生成可工作的漏洞利用代码,中间层会直接给出代码和文档,而 GPT-5.5-Cyber 甚至可以在测试环境中执行攻击。OpenAI 强调,Cyber 版本并不是更“聪明”,而只是对安全主题的限制更少。

OpenAI 向审核安全研究者开放 GPT-5.5-Cyber

资讯正文

OpenAI 向经过审核的安全研究人员开放 GPT-5.5-Cyber

要点

- OpenAI 发布了 GPT-5.5-Cyber,这是一款安全过滤更少的模型,允许经过审核的安全研究人员执行渗透测试和恶意软件分析等任务。

- 访问权限采用分级制度,限制最少的版本仅面向关键基础设施的授权防御方开放,并与 Cisco、CrowdStrike 等公司合作。

- 该模型在网络攻击基准测试中的表现与 Anthropic 的 Mythos 大致相当,而白宫正在考虑对这类发布进行监管。

OpenAI 正在向安全研究人员提供 GPT-5.5 的访问权限,并发布一个名为 GPT-5.5-Cyber 的专门变体,该版本会拒绝更少的请求。目前,只有通过公司“Trusted Access for Cyber”计划审核、负责保护关键基础设施的防御方才能获得访问权限。

标准聊天机器人通常会阻止那些听起来像是在索要黑客入侵指南的请求,这是一种防止滥用的安全措施。但同样的过滤器也会妨碍合法的安全工作,例如研究人员需要复现已知漏洞以便修补时。

OpenAI 现在将访问权限分成三档:带有标准限制的公开模型、为防御性工作放宽过滤的中间层,以及限制最少、用于授权渗透测试的 GPT-5.5-Cyber。

该系统允许分析恶意软件或审查安全补丁等任务。根据 OpenAI 的说法,它仍然会阻止窃取密码或攻击第三方系统之类的行为。

护栏究竟松动了多少

公告中的示例显示,限制被放宽到了什么程度。让公开模型为已知漏洞编写一个可工作的利用程序,它会拒绝;中间层则会连同文档一起给出代码。GPT-5.5-Cyber 还会更进一步。在一个演示场景中,它实际上会对测试服务器发起攻击,接管系统,并读取系统信息。

OpenAI 强调,Cyber 变体并不是比标准模型更聪明,只是在安全相关主题上限制更少。从 2026 年 6 月 1 日起,最高访问层级的个人用户将需要启用防网络钓鱼认证。首批合作伙伴包括 Cisco、CrowdStrike、Palo Alto Networks、Cloudflare、Intel、Snyk 和 SentinelOne。通过 Codex Security,部分正在大型开源项目上工作的开发者也可获得折扣访问权限。

与 Anthropic 的 Mythos 竞速

此次发布之际,硅谷和白宫都在应对新一代 AI 模型的进攻能力。Axios 从一位消息人士处获悉,GPT-5.5-Cyber 在发现和利用软件漏洞方面的表现,与 Anthropic 的 Mythos Preview 大致相当。

Anthropic 采取了更严格的做法,通过其 Project Glasswing 将 Mythos 的访问权限限制在约 40 个组织。OpenAI 则通过分级系统扩大了覆盖范围。与此同时,据报道,白宫正在讨论行政命令,以便让政府在这些模型如何发布方面拥有更多发言权。

英国的 AI Security Institute 近日在一系列模拟攻击中对 GPT-5.5 进行了测试,目标是一家企业网络,共包含 32 个步骤。该模型在 10 次运行中有 2 次完成了完整攻击链,而 Mythos 在 10 次运行中完成了 3 次。若看单项专家级任务,GPT-5.5 实际上略占上风。

来源与参考

  1. 原始链接
  2. OpenAI opens GPT-5.5-Cyber to vetted security researchers

收录于 2026-05-09