GPT-5.5在网络安全任务中与Mythos表现相当，挑战Anthropic的宣传

Ars Technica AI·5月1日 23:32 UTC·作者 Kyle Orland

关键信息

GPT-5.5在专家级CTF任务中得分为71.4%，略高于Mythos Preview的68.6%，并在一项困难的Rust二进制反汇编挑战中以更低的成本更快完成，但两者均未能通过Cooling Tower电力设施模拟测试。

资讯摘要

英国人工智能安全研究所使用95个网络安全CTF挑战对GPT-5.5和Anthropic的Mythos Preview进行了测试。GPT-5.5在整体表现上与Mythos相当，在一个困难的Rust二进制反汇编任务中仅用10分钟、花费1.73美元就完成了。两者在模拟企业网络攻击的'The Last Ones'测试中也表现一致。

然而，它们都无法在Cooling Tower测试中破坏电力设施控制系统。研究结果表明，网络安全能力并非某一模型独有，而是源于推理和编码能力的整体提升。OpenAI首席执行官山姆·阿尔特曼批评Anthropic的做法是‘恐惧营销’，并指出未来模型可能需要受控发布——不是因为它们本身危险，而是因为可能被滥用。

GPT-5.5在网络安全任务中与Mythos表现相当，挑战Anthropic的宣传

资讯正文

上个月，Anthropic公司大肆宣传其Mythos Preview模型所代表的网络安全威胁，导致该公司将初始版本仅限于“关键行业合作伙伴”使用。但英国人工智能安全研究所（AISI）的新研究显示，OpenAI上周公开发布的GPT-5.5在网络安全评估中表现“与Mythos Preview相当”。

自2023年以来，AISI已对多种前沿AI模型进行了95项名为“夺旗”的挑战测试，这些挑战旨在检验模型在逆向工程、网络攻击和密码学等网络安全任务中的能力。在最高级别的“专家级”任务中，GPT-5.5平均通过率为71.4%，略高于Mythos Preview的68.6%（尽管在误差范围内）。在一项特别困难的任务中，要求构建一个反汇编器来解码Rust二进制文件，AISI指出：“GPT-5.5仅用10分22秒就完成了挑战，且无需人工协助，API调用成本仅为1.73美元。”

GPT-5.5还在AISI设计的“最后之人”（TLO）测试中与Mythos Preview表现一致，该测试模拟了对企业网络进行32步数据提取攻击的过程。GPT-5.5在10次尝试中有3次成功，而Mythos Preview则为2次——此前没有任何模型曾在此测试中成功过。不过，GPT-5.5仍然无法完成AISI更复杂的“冷却塔”模拟任务，该任务试图破坏一家电厂控制软件，所有此前测试过的AI模型也都未能成功。

这是否只是“恐惧驱动的营销”？

AISI表示，GPT-5.5的最新结果表明，从网络安全风险角度来看，Mythos Preview可能并非“某一特定模型的重大突破”，而是“更广泛改进的结果，包括长周期自主性、推理能力和编码能力的提升”。

在最近接受Core Memory播客采访时，OpenAI首席执行官山姆·阿尔特曼批评了他所谓的“基于恐惧的营销”，即某些AI模型通过限制发布来制造噱头。他表示：“我确信Mythos在网络安全方面是一个优秀的模型，但说‘我们造出了炸弹，即将砸向你们头上，你可以花一亿美元买个避难所’，这显然是一种极好的营销策略。”

阿尔特曼继续说道：“未来会有更多关于某些模型过于危险而不能发布的言论，同时也会有一些非常危险的模型必须以不同的方式发布。”

今年2月，OpenAI推出了面向网络安全的“可信访问试点计划”，允许安全研究人员和企业验证身份并注册兴趣，以便开展针对OpenAI前沿模型的“合法防御性研究”。上个月，OpenAI表示，它正在利用这个可信访问名单来控制GPT-5.4-Cyber的有限发布，该版本声称是“专门微调以增强网络安全能力，并减少能力限制”。

本周四，OpenAI首席执行官山姆·阿尔特曼在社交媒体上表示，GPT-5.5-Cyber的初始版本也将仅限于“未来几天内的重要网络安全防御者”使用。

1. 多年来最严重的Linux威胁突然出现，让全球措手不及

2. 埃隆·马斯克在OpenAI庭审中作证时犯下的七大失误

3. 俄罗斯在航天发射场落入乌克兰视线后隐藏了发射计划

4. Meta解雇了报告称看到Ray-Ban Meta用户发生性行为的承包商

5. 特朗普提名福克斯新闻医生担任下一任外科医生总长

来源与参考

收录于 2026-05-02