GPT-5.5在网络安全任务中与Mythos表现相当,挑战Anthropic的宣传
Ars Technica AI··作者 Kyle Orland
关键信息
GPT-5.5在专家级CTF任务中得分为71.4%,略高于Mythos Preview的68.6%,并在一项困难的Rust二进制反汇编挑战中以更低的成本更快完成,但两者均未能通过Cooling Tower电力设施模拟测试。
资讯摘要
英国人工智能安全研究所使用95个网络安全CTF挑战对GPT-5.5和Anthropic的Mythos Preview进行了测试。GPT-5.5在整体表现上与Mythos相当,在一个困难的Rust二进制反汇编任务中仅用10分钟、花费1.73美元就完成了。两者在模拟企业网络攻击的'The Last Ones'测试中也表现一致。
然而,它们都无法在Cooling Tower测试中破坏电力设施控制系统。研究结果表明,网络安全能力并非某一模型独有,而是源于推理和编码能力的整体提升。OpenAI首席执行官山姆·阿尔特曼批评Anthropic的做法是‘恐惧营销’,并指出未来模型可能需要受控发布——不是因为它们本身危险,而是因为可能被滥用。

资讯正文
上个月,Anthropic公司大肆宣传其Mythos Preview模型所代表的网络安全威胁,导致该公司将初始版本仅限于“关键行业合作伙伴”使用。但英国人工智能安全研究所(AISI)的新研究显示,OpenAI上周公开发布的GPT-5.5在网络安全评估中表现“与Mythos Preview相当”。
自2023年以来,AISI已对多种前沿AI模型进行了95项名为“夺旗”的挑战测试,这些挑战旨在检验模型在逆向工程、网络攻击和密码学等网络安全任务中的能力。在最高级别的“专家级”任务中,GPT-5.5平均通过率为71.4%,略高于Mythos Preview的68.6%(尽管在误差范围内)。在一项特别困难的任务中,要求构建一个反汇编器来解码Rust二进制文件,AISI指出:“GPT-5.5仅用10分22秒就完成了挑战,且无需人工协助,API调用成本仅为1.73美元。”
GPT-5.5还在AISI设计的“最后之人”(TLO)测试中与Mythos Preview表现一致,该测试模拟了对企业网络进行32步数据提取攻击的过程。GPT-5.5在10次尝试中有3次成功,而Mythos Preview则为2次——此前没有任何模型曾在此测试中成功过。不过,GPT-5.5仍然无法完成AISI更复杂的“冷却塔”模拟任务,该任务试图破坏一家电厂控制软件,所有此前测试过的AI模型也都未能成功。
这是否只是“恐惧驱动的营销”?
AISI表示,GPT-5.5的最新结果表明,从网络安全风险角度来看,Mythos Preview可能并非“某一特定模型的重大突破”,而是“更广泛改进的结果,包括长周期自主性、推理能力和编码能力的提升”。
在最近接受Core Memory播客采访时,OpenAI首席执行官山姆·阿尔特曼批评了他所谓的“基于恐惧的营销”,即某些AI模型通过限制发布来制造噱头。他表示:“我确信Mythos在网络安全方面是一个优秀的模型,但说‘我们造出了炸弹,即将砸向你们头上,你可以花一亿美元买个避难所’,这显然是一种极好的营销策略。”
阿尔特曼继续说道:“未来会有更多关于某些模型过于危险而不能发布的言论,同时也会有一些非常危险的模型必须以不同的方式发布。”
今年2月,OpenAI推出了面向网络安全的“可信访问试点计划”,允许安全研究人员和企业验证身份并注册兴趣,以便开展针对OpenAI前沿模型的“合法防御性研究”。上个月,OpenAI表示,它正在利用这个可信访问名单来控制GPT-5.4-Cyber的有限发布,该版本声称是“专门微调以增强网络安全能力,并减少能力限制”。
本周四,OpenAI首席执行官山姆·阿尔特曼在社交媒体上表示,GPT-5.5-Cyber的初始版本也将仅限于“未来几天内的重要网络安全防御者”使用。
1. 多年来最严重的Linux威胁突然出现,让全球措手不及
2. 埃隆·马斯克在OpenAI庭审中作证时犯下的七大失误
3. 俄罗斯在航天发射场落入乌克兰视线后隐藏了发射计划
4. Meta解雇了报告称看到Ray-Ban Meta用户发生性行为的承包商
5. 特朗普提名福克斯新闻医生担任下一任外科医生总长
来源与参考
收录于 2026-05-02