前沿AI代理将自动化零日漏洞研究

Simon Willison·4月4日 07:59 UTC·作者 Simon Willison

关键信息

LLM代理可以利用预训练的漏洞类别知识（如类型混淆或悬空指针）并通过成功/失败试验测试漏洞结果——这是它们能无疲劳持续执行的任务。

资讯摘要

托马斯·普特克认为，前沿AI模型很快将通过简单地指向源码树并要求其寻找零日漏洞来自动化大部分高影响力漏洞研究。这些代理得益于对代码关联性和已知漏洞模式的海量预训练知识，能够比人类更高效地执行复杂的模式匹配和约束求解。

与人类不同的是，代理不会感到疲惫——只要被指示，它们就能无限期搜索。这种自动化将重塑漏洞开发的实践和经济模式，可能降低恶意行为者的门槛，同时也为防御方提供新工具。

资讯正文

3月26日，2026年 - Link Blog

漏洞研究已走向终结。托马斯·普塔切克（Thomas Ptacek）对最新前沿模型对漏洞研究领域造成突然且巨大影响的看法。

在接下来的几个月里，编码代理将彻底改变漏洞利用开发的实践方式和经济模式。前沿模型的进步不会是渐进式的，而是一次跃迁式的提升。大量高影响力的漏洞研究工作（甚至可能是绝大多数）将仅仅通过将一个代理指向源代码树并输入“帮我找到零日漏洞”来完成。

为什么代理在这项任务上如此出色？这是因为它们融合了内置知识、模式识别能力和蛮力搜索能力：

你无法为大型语言模型代理设计出比漏洞利用研究更合适的问题。在你向它输入任何上下文之前，前沿大模型已经编码了海量源代码中令人难以置信的关联信息。Linux KVM虚拟机监控程序是否与hrtimer子系统、workqueue或perf_event相关？模型知道。这些模型权重中还内嵌了所有漏洞开发所依赖的完整文档化‘漏洞类别’库：悬空指针、整数处理错误、类型混淆、分配器预处理，以及在Firefox中将野指针写入转换为可控的64位读/写的所有已知方法。

漏洞的发现本质上是通过匹配漏洞类别并解决可达性和可利用性的约束条件实现的——这正是大型语言模型最擅长解决的隐式搜索问题。漏洞利用的结果也容易验证，只需进行成功/失败的测试即可。只要告诉代理继续搜索，它永远不会感到厌倦，会永远不停地找下去。

你无法为大型语言模型代理设计出比漏洞利用研究更合适的问题。

漏洞研究已变质

这篇文章部分受到Security Cryptography Whatever播客一期节目启发，该期节目时长1小时16分钟，由David Adrian、Deirdre Connolly和Thomas采访Anthropic公司的Nicholas Carlini。

我刚刚在这里创建了一个新的标签ai-security-research，目前已收录11篇文章。

近期文章

Axios供应链攻击使用了针对个体的社会工程手段——2026年4月3日

关于代理工程（agentic engineering）在Lenny播客上的对话亮点——2026年4月2日

Mr. Chatterbox是一个可在个人电脑上运行的（弱）维多利亚时代伦理训练模型——2026年3月30日

这是Simon Willison于2026年4月3日发布的链接文章。

来源与参考

收录于 2026-04-05