AI攻击性网络能力每5.7个月翻倍
The Decoder··作者 Matthias Bastian
关键信息
研究使用METR时间阈值法测量AI模型在50%成功率下完成任务所需时间,结果显示呈指数增长。开源模型比闭源模型落后约5.7个月,表明能力发展存在显著差距。
资讯摘要
Lyptus Research发布了一项突破性研究,显示自2024年以来,AI的攻击性网络安全能力每5.7个月翻一番——早前为每9.8个月翻一番。该研究基于291个网络安全任务测试,采用METR时间阈值法并由十位专业安全专家参与。GPT-5.3 Codex和Opus 4.6在两百万token预算下可在三小时内达到50%的成功率。
性能随token增加显著提升:当token增至一千万时,GPT-5.3 Codex的完成时间从3.1小时跃升至10.5小时。研究人员警告称,这表明他们可能仍在低估AI的真实进步速度。

资讯正文
AI进攻性网络能力每六个月翻一番,安全研究人员发现
AI安全研究公司Lyptus Research发布了一项关于AI模型进攻性网络安全能力的新研究。该研究基于METR时间跨度方法,涉及十位专业安全专家的测试。
根据研究结果,自2019年以来,AI的进攻性网络能力每9.8个月翻一番;而自2024年起,这一速度已加速至每5.7个月翻一番。Opus 4.6和GPT-5.3 Codex现在能够在两百万token预算下以50%的成功率完成原本需要人类专家约三小时才能完成的任务。
当token预算更高时,性能提升显著:GPT-5.3 Codex在获得一千万token而非两百万token时,其任务完成时间从3.1小时延长到10.5小时。研究人员表示,这表明他们仍在低估实际的进步速度。开源模型比闭源模型落后约5.7个月。
该研究共涵盖291项任务。所有数据均可在GitHub和Hugging Face上获取,完整报告可在此处查看。
来源与参考
收录于 2026-04-06