英国政府测试揭示 Mythos 可串联网络攻击

Ars Technica AI·4月15日 03:11 UTC·作者 Kyle Orland

关键信息

尽管 Mythos 在标准夺旗任务中得分超过85%，但其真正独特之处在于完成了高复杂度的‘最后的那些人’挑战——这是一个需要跨主机和网络段协调的32步攻击，据估计训练有素的人类需花费约20小时才能完成。

资讯摘要

英国政府的人工智能安全研究所发布了一份对 Anthropic 公司 Mythos 预览版模型的评估报告，揭示了其将网络安全任务串联成多步骤攻击的能力。尽管 Mythos 在基本夺旗挑战中表现与 GPT-5.4 和 Opus 4.6 等先进模型相当，但在更复杂的‘最后的那些人’测试中显著领先——该测试模拟了一个需要32步协调操作的企业网络入侵。AISI 设计此测试是为了模仿现实中需要人类专家和时间才能完成的持续性攻击。

结果表明，AI 已经能够执行过去被认为只有熟练攻击者才能完成的操作。这引发关于此类模型应如何监管和负责任部署的紧迫问题。

资讯正文

英国政府的Mythos AI测试帮助区分网络安全威胁与炒作

上周，Anthropic宣布将限制其Mythos Preview模型的初始发布范围，仅向“少数关键行业合作伙伴”开放，以便他们为这款被描述为在计算机安全任务上‘表现惊人’的模型做好准备。现在，英国政府的人工智能安全研究所（AISI）发布了对这一模型网络攻击能力的初步评估，为Anthropic此前的报告提供了独立的公开验证。

AISI的发现表明，在单独的网络安全相关任务测试中，Mythos与其他近期前沿模型并无显著差异。但Mythos可能通过有效串联这些任务，形成多步骤攻击序列，从而区别于以往模型——这种能力是完全渗透某些系统所必需的。

《最后的那些人》终于落下帷幕

自2023年初以来，AISI一直在使用专门设计的CTF（夺旗）挑战测试各类AI模型，当时GPT-3.5 Turbo甚至无法完成相对简单的“学徒级”任务。此后，后续模型的表现稳步提升，以至于Mythos Preview能够完成超过85%的相同学徒级CTF任务。

尽管这在AISI的CTF测试中是一个技术上的高点，但最近的竞争模型如GPT-5.4以及Anthropic自身的Opus 4.6和Codex 5.3在多个CTF难度级别上也表现出相当的结果（准确率相差5至10个百分点）。这似乎并不足以说明需要像Anthropic对Mythos Preview采取的那种保护性有限发布策略。

然而，Mythos在另一个测试场景中展现出更突出的潜在攻击能力：名为《最后的那些人》（TLO）的测试范围，AISI为此模拟了对企业网络进行32步数据提取攻击的过程。该测试要求‘在多个主机和网络段之间串联数十个步骤’，旨在模拟训练有素的人类完成此类持续性操作大约需要20小时的工作量，AISI估计如此。

来源与参考

收录于 2026-04-15