GPT-5.5在网络安全任务中与Mythos表现相当,挑战Anthropic的宣传

Ars Technica AI··作者 Kyle Orland

关键信息

GPT-5.5在专家级CTF任务中得分为71.4%,略高于Mythos Preview的68.6%,并在一项困难的Rust二进制反汇编挑战中以更低的成本更快完成,但两者均未能通过Cooling Tower电力设施模拟测试。

资讯摘要

英国人工智能安全研究所使用95个网络安全CTF挑战对GPT-5.5和Anthropic的Mythos Preview进行了测试。GPT-5.5在整体表现上与Mythos相当,在一个困难的Rust二进制反汇编任务中仅用10分钟、花费1.73美元就完成了。两者在模拟企业网络攻击的'The Last Ones'测试中也表现一致。

然而,它们都无法在Cooling Tower测试中破坏电力设施控制系统。研究结果表明,网络安全能力并非某一模型独有,而是源于推理和编码能力的整体提升。OpenAI首席执行官山姆·阿尔特曼批评Anthropic的做法是‘恐惧营销’,并指出未来模型可能需要受控发布——不是因为它们本身危险,而是因为可能被滥用。

GPT-5.5在网络安全任务中与Mythos表现相当,挑战Anthropic的宣传

资讯正文

上个月,Anthropic公司大肆宣传其Mythos Preview模型所代表的网络安全威胁,导致该公司将初始版本仅限于“关键行业合作伙伴”使用。但英国人工智能安全研究所(AISI)的新研究显示,OpenAI上周公开发布的GPT-5.5在网络安全评估中表现“与Mythos Preview相当”。

自2023年以来,AISI已对多种前沿AI模型进行了95项名为“夺旗”的挑战测试,这些挑战旨在检验模型在逆向工程、网络攻击和密码学等网络安全任务中的能力。在最高级别的“专家级”任务中,GPT-5.5平均通过率为71.4%,略高于Mythos Preview的68.6%(尽管在误差范围内)。在一项特别困难的任务中,要求构建一个反汇编器来解码Rust二进制文件,AISI指出:“GPT-5.5仅用10分22秒就完成了挑战,且无需人工协助,API调用成本仅为1.73美元。”

GPT-5.5还在AISI设计的“最后之人”(TLO)测试中与Mythos Preview表现一致,该测试模拟了对企业网络进行32步数据提取攻击的过程。GPT-5.5在10次尝试中有3次成功,而Mythos Preview则为2次——此前没有任何模型曾在此测试中成功过。不过,GPT-5.5仍然无法完成AISI更复杂的“冷却塔”模拟任务,该任务试图破坏一家电厂控制软件,所有此前测试过的AI模型也都未能成功。

这是否只是“恐惧驱动的营销”?

AISI表示,GPT-5.5的最新结果表明,从网络安全风险角度来看,Mythos Preview可能并非“某一特定模型的重大突破”,而是“更广泛改进的结果,包括长周期自主性、推理能力和编码能力的提升”。

在最近接受Core Memory播客采访时,OpenAI首席执行官山姆·阿尔特曼批评了他所谓的“基于恐惧的营销”,即某些AI模型通过限制发布来制造噱头。他表示:“我确信Mythos在网络安全方面是一个优秀的模型,但说‘我们造出了炸弹,即将砸向你们头上,你可以花一亿美元买个避难所’,这显然是一种极好的营销策略。”

阿尔特曼继续说道:“未来会有更多关于某些模型过于危险而不能发布的言论,同时也会有一些非常危险的模型必须以不同的方式发布。”

今年2月,OpenAI推出了面向网络安全的“可信访问试点计划”,允许安全研究人员和企业验证身份并注册兴趣,以便开展针对OpenAI前沿模型的“合法防御性研究”。上个月,OpenAI表示,它正在利用这个可信访问名单来控制GPT-5.4-Cyber的有限发布,该版本声称是“专门微调以增强网络安全能力,并减少能力限制”。

本周四,OpenAI首席执行官山姆·阿尔特曼在社交媒体上表示,GPT-5.5-Cyber的初始版本也将仅限于“未来几天内的重要网络安全防御者”使用。

1. 多年来最严重的Linux威胁突然出现,让全球措手不及

2. 埃隆·马斯克在OpenAI庭审中作证时犯下的七大失误

3. 俄罗斯在航天发射场落入乌克兰视线后隐藏了发射计划

4. Meta解雇了报告称看到Ray-Ban Meta用户发生性行为的承包商

5. 特朗普提名福克斯新闻医生担任下一任外科医生总长

来源与参考

  1. 原始链接
  2. Amid Mythos' hyped cybersecurity prowess, researchers find GPT-5.5 is just as good

收录于 2026-05-02