Topic
#ai-security
按主题聚合的新闻视图。
Topic Feed
主题:ai-security
共 41 条

Mistral CEO警告军用代码扫描AI依赖风险
Mistral AI 首席执行官 Arthur Mensch 在法国一个议会调查委员会前表示,欧洲应谨慎允许 Anthropic 的 Mythos 模型扫描法国军用代码库。他认为,将这类模型用于敏感网络安全工作,可能会形成一种几乎无法逆转的依赖关系。

基准显示 AI 可自主构建浏览器漏洞利用
卡内基梅隆大学研究人员发布了一个新基准,用来衡量 AI 代理利用谷歌 V8 JavaScript 引擎真实漏洞的能力,最高可达到任意代码执行。测试中,Anthropic 的 Claude Mythos Preview 明显优于 OpenAI 的 GPT-5.5,但成本也高得多。

AI将补丁到利用的时间压缩到几分钟
安全研究员 Himanshu Anand 认为,语言模型现在可以在短短 30 分钟内把安全补丁转化为可用的漏洞利用代码。他指出,这正在打破传统的 90 天漏洞披露模式,因为补丁一出现,攻击者和独立研究者几乎可以同步行动。

OpenAI 向审核安全研究者开放 GPT-5.5-Cyber
OpenAI 发布了 GPT-5.5-Cyber,这是一个针对网络安全场景、拒绝更少的 GPT-5.5 变体,并向经过审核的安全研究人员开放。限制最严格的访问权限则只提供给通过 OpenAI “Trusted Access for Cyber” 计划认证的关键基础设施防御者。

Mozilla用代理式AI发现271个Firefox漏洞
Mozilla开发者使用Anthropic的 Claude Mythos Preview 通过代理式AI流水线,发现并帮助修复了 Firefox 150 中271个此前未知的漏洞。这一工作推动Mozilla在4月解决了423个安全问题,远高于3月的76个。

Mozilla用Mythos发现271个Firefox漏洞
Mozilla表示,借助 Anthropic 的 Mythos AI 模型,他们在两个月内发现了 271 个 Firefox 安全漏洞,而且“几乎没有误报”。Mozilla 说,这一结果来自模型能力提升以及为 Firefox 代码库和测试流程定制的 agent harness。

Mythos 提升 Firefox 漏洞发现能力
Mozilla 表示,Anthropic 的 Mythos 模型发现高严重性 Firefox 漏洞的能力,明显强于此前的 AI 安全工具,甚至找出了沉睡十多年之久的问题。Firefox 团队称,2026 年 4 月浏览器共发布了 423 个漏洞修复,而一年前同期只有 31 个。
OpenAI 扩展网络安全可信访问
OpenAI 正在借助 GPT-5.5 和 GPT-5.5-Cyber 扩展“网络安全可信访问”。这项更新旨在让经过验证的防御者更快获得高级网络能力,用于漏洞研究和关键基础设施保护。

将AI置于核心位置重新思考网络安全
GC Cybersecurity的创始人兼CEO塔里克·穆斯塔法指出,网络安全必须从底层重新设计,将人工智能作为基础要素,而非事后补充。这一转变是因为人工智能显著扩大了攻击面,并引入了传统安全方法无法应对的新复杂性。

GPT-5.5在网络安全任务中与Mythos表现相当,挑战Anthropic的宣传
英国人工智能安全研究所的研究表明,OpenAI的GPT-5.5在网络安全基准测试中与Anthropic的Mythos Preview表现相当,包括CTF挑战和构建反汇编器等复杂任务。

Anthropic推出Claude Security,提供AI驱动的代码扫描功能
Anthropic已向企业客户推出Claude Security的公开测试版,利用Claude Opus 4.7模型进行跨模块代码漏洞扫描,而不仅仅是基于模式匹配。该工具提供严重性、可复现性和置信度评分,并支持Slack、Jira集成和定时扫描功能。

GPT-5.5在网络安全测试中与Claude Mythos持平
英国人工智能安全研究所(AISI)发现,OpenAI的GPT-5.5在网络安全攻击模拟中的表现与Anthropic的Claude Mythos Preview相当,尤其是在名为“最后之人”(The Last Ones)的复杂多阶段网络攻击场景中。这是继Mythos之后第二个完全解决此类模拟的模型,表明攻击能力正随着通用智能提升而自然出现。

OpenAI与Yubico合作推出高级账户安全功能以防范钓鱼攻击
OpenAI推出了高级账户安全(AAS)计划,该计划通过与Yubico合作提供定制版YubiKey C NFC和YubiKey C Nano硬件密钥,帮助用户防范钓鱼攻击。

Anthropic推出Claude Security,实现AI驱动的代码漏洞扫描
Anthropic推出了Claude Security,这是一个利用Opus 4.7模型扫描整个代码库漏洞并提供优先修复建议的Beta工具。这是旨在保护关键开源软件基础设施的Project Glasswing计划的一部分。

AI驱动的脚本小子:新型网络安全威胁
Anthropic推出的Claude Mythos AI模型展示了在真实代码中发现漏洞的能力,甚至无需人工干预。这标志着传统脚本小子(仅依赖现成工具)的升级,现在他们能借助先进AI大规模利用漏洞。

间接提示注入攻击的工作原理及六种防御方法
间接提示注入攻击通过在可信的外部内容(如网页或邮件)中嵌入恶意指令来利用AI系统,且无需用户交互即可触发。文章列出了六种实用的防御策略以阻止此类隐蔽攻击。

OpenAI新可信访问计划向微软提供先进AI用于网络安全防御
OpenAI推出了‘可信访问网络安全’计划,向微软提供其最强大的AI模型(如GPT-5.4-Cyber)用于网络安全防御。作为交换,微软承诺动用全部网络安全团队来保护OpenAI的模型、基础设施和共同客户。

谷歌部署320亿美元AI网络安全力量应对日益升级的威胁
在谷歌云Next 2026大会上,谷歌推出了一套由AI代理驱动的防御组合,用于主动检测和响应威胁,并以320亿美元收购网络安全公司Wiz作为支撑。

Anthropic的Mythos AI模型被未经授权用户访问
Anthropic公司高度敏感的网络安全AI模型Mythos被一小群未经授权的用户通过第三方承包商和网络调查工具获取。该小组据称于4月7日获得访问权限,当天正是Anthropic宣布在Project Glasswing计划下有限发布该模型的日子。
Mozilla与Anthropic利用Claude Mythos发现Firefox中的271个漏洞
Mozilla在Firefox中使用了Anthropic早期版本的Claude Mythos Preview进行分析,发现了271个漏洞,并已在Firefox 150版本中修复。

未经授权团体获取Anthropic的Mythos AI网络安全工具
据报道,一个未经授权的团体通过第三方供应商的凭证获得了Anthropic独家AI网络安全工具Mythos的访问权限。该团体是私人Discord频道成员,在工具发布当天就获取了访问权限,并用于非恶意测试。

Mozilla称Anthropic的Mythos发现Firefox 150中271个零日漏洞
Mozilla报告称,Anthropic的Mythos人工智能模型在Firefox 150早期测试中发现了271个此前未知的零日漏洞。这标志着利用AI提前发现安全漏洞这一里程碑事件。

网络犯罪分子利用AI增强诈骗手段
网络犯罪分子正在使用生成式AI创建更具欺骗性的钓鱼邮件、深度伪造视频和难以检测的恶意软件。他们还自动化漏洞扫描和勒索信生成,使攻击更快、更便宜且更具规模。

AI网络安全需要开放系统,而不仅仅是大模型
文章介绍了Mythos这一前沿AI模型,它在发现和修补软件漏洞方面表现出色——并非仅仅因为其规模,而是因为它嵌入在一个包含计算能力、数据、支撑结构(scaffolding)、速度和自主性的综合系统中。

美国国家安全局使用Anthropic的Mythos模型,尽管五角大楼已将其列为风险源
美国国家安全局(NSA)正在使用Anthropic公司受限的AI模型Mythos Preview进行网络安全任务,如漏洞扫描。这发生在国防部将Anthropic标记为‘供应链风险’并禁止其在联邦机构中使用之后。

小型开源模型复现了Claude Mythos的网络安全能力
两项独立研究表明,小型开源AI模型能够发现并利用Anthropic专有模型Claude Mythos声称独有的软件漏洞。这些模型在发现FreeBSD NFS代码中的CVE-2026-4747漏洞方面与Claude Mythos表现相当甚至更优。

Cal.com因AI安全风险放弃开源模式
成功的开源日程安排工具Cal.com正从GNU Affero通用公共许可证(AGPL)转为专有许可,因为像Claude Opus这样的AI工具现在可以轻松发现其代码库中的漏洞。

英国政府测试揭示 Mythos 可串联网络攻击
英国人工智能安全研究所(AISI)评估了 Anthropic 的 Mythos 预览版模型,发现它能够将多个网络安全任务串联成复杂的多步骤攻击——尤其是在名为“最后的那些人”(The Last Ones)的模拟32步数据提取场景中。这种能力使其区别于早期只能执行单一任务而无法组织完整攻击序列的模型。

Claude Mythos在自主网络攻击中实现73%成功率
Anthropic的Claude Mythos Preview在模拟企业网络上实现了73%的成功率,自主执行了完整的32步网络攻击,这是首个无需人工干预即可完成此类端到端攻击的AI模型。

Cloudflare发布企业级MCP安全部署参考架构
Cloudflare发布了用于企业级Model Context Protocol(MCP)安全扩展的参考架构,整合了Cloudflare One(SASE)和开发者平台的安全控制措施,以应对提示注入和供应链漏洞等风险。他们还推出了两项新功能:通过MCP服务器门户实现代码模式以降低token成本,以及使用Cloudflare网关进行影子MCP检测以发现未经授权的远程服务器。

OpenAI为特定公司开发网络安全产品
OpenAI正在推出名为“可信访问网络安全”的试点项目,向选定公司提供先进AI模型和1000万美元API积分,用于防御性网络安全工作。该计划与即将发布的‘Spud’模型无关,此前报道曾误将两者混为一谈。

Anthropic限制访问其新网络安全AI模型Mythos
Anthropic已将新的网络安全AI模型Claude Mythos Preview仅限于亚马逊、苹果和微软等选定企业使用,并正在与美国政府讨论其应用。这发生在两次内部文件和源代码泄露事件之后。

苹果、谷歌、微软加入Anthropic的Project Glasswing项目,用AI加强网络安全
苹果、谷歌、微软与Anthropic联合启动了Project Glasswing项目,利用人工智能(特别是未发布的Claude Mythos Preview模型)来发现并修复关键软件系统中的隐藏漏洞。该项目包括400万美元直接资金和1亿美元的AI计算资源支持。

OpenAI、Anthropic 和谷歌联手打击AI模型盗用
OpenAI、Anthropic 和谷歌通过前沿模型论坛合作,检测并阻止对抗性蒸馏技术——这是一种由中国竞争对手使用的手段,通过利用原始模型的输出来训练成本更低的复制品。

OpenClaw安全漏洞迫使用户假设系统已被入侵
OpenClaw中发现了一个高危漏洞(CVE-2026-33579),攻击者只需最低权限即可无需用户交互直接获得完全管理权限。该漏洞已在2026.3.28版本中修复,但许多实例可能早已被攻破。

Anthropic在软件更新中泄露近2000个源代码文件
Anthropic在Claude Code软件包的版本2.1.88中意外包含了近2000个源代码文件和超过51.2万行代码。这是该公司一周内发生的第二次重大内部泄露事件。

Claude代码泄露揭示宠物界面与始终在线代理
Anthropic的Claude Code 2.1.88版本源代码泄露暴露了实验性功能,包括一个会响应用户编码行为的Tamagotchi风格宠物,以及一个名为KAIROS的后台代理,即使应用窗口关闭也能持续运行。

Claude Code 命令行工具源代码因暴露映射文件而泄露
Anthropic 在 Claude Code 的 npm 包版本 2.1.88 中意外包含了源映射文件,导致近 2000 个 TypeScript 文件和超过 51.2 万行代码被公开。该漏洞很快被安全研究员 Chaofan Shou 发现,并在 GitHub 上广泛传播。

LiteLLM因安全丑闻放弃合规公司Delve
广泛使用的AI网关LiteLLM在发现Delve涉嫌提供虚假认证并牵涉到其开源版本遭受恶意软件攻击后,终止了与该合规公司的合作。