Armin Ronacher 谈 AI 处理后的缺陷报告
Simon Willison··作者 Simon Willison
关键信息
Ronacher 批评的,是那些包含“伪最小复现”、建议实现方案、拿错误代码做类比,以及列出一长串可能并不相关的错误类别的报告。他偏好的形式,本质上就是以报告者亲眼观察到的内容为基础的最小化、可复现描述。
资讯摘要
2026 年 5 月 24 日,Simon Willison 发布了 Armin Ronacher 的一段引述,谈论 issue 跟踪中越来越常见的一种烦恼:缺陷报告被 AI 改写,而不是由报告者用自己的话写出来。Ronacher 说,这类报告通常确实基于真实观察到的问题,但随后被送进语言模型重新措辞,结果变得更混乱、也更不可靠。他指出,提示词如果写得不好,AI 往往会给出看似自信、实际上却不准确的根因结论。Ronacher 还提到,这类报告常常会包含虚构的最小复现、带有猜测性的实现建议、拿错误的代码路径做类比,以及与问题可能无关的错误类别列表。
相比之下,他更希望维护者看到的是非常朴素但高价值的信息。也就是:执行了什么命令、预期发生什么、实际发生了什么,以及精确的错误信息或日志输出。该引述还提到这是针对 Pi 遇到的“slop issues”,因此也反映出 AI 辅助写作与技术沟通准确性之间的矛盾。
资讯正文
2026年5月24日
当前最令人沮丧的一种失败模式是,人们提交的问题并不是用他们自己的语言写的。里面某处确实包含了一个被观察到的问题,但它被扔进了一个 clanker 里,而 clanker 把它改写得一塌糊涂。通常,这些内容的提示方式糟糕透顶,以至于得出的结论大多并不准确,却总是充满自信。结果就是:对根本原因的彻底瞎猜、伪装得很小的复现步骤、建议的实现策略、把问题类比到相邻但往往错误的代码,以及一长串也许有用、也许毫无关系的错误类别。[…] 所以,至少就我个人而言,我越来越希望问题报告能被压缩成那个人实际观察到的内容:我运行了这个命令。我本以为会发生这样的事。结果却发生了这个。这里是精确的错误信息或日志。
当前最令人沮丧的一种失败模式是,人们提交的问题并不是用他们自己的语言写的。里面某处确实包含了一个被观察到的问题,但它被扔进了一个 clanker 里,而 clanker 把它改写得一塌糊涂。通常,这些内容的提示方式糟糕透顶,以至于得出的结论大多并不准确,却总是充满自信。结果就是:对根本原因的彻底瞎猜、伪装得很小的复现步骤、建议的实现策略、把问题类比到相邻但往往错误的代码,以及一长串也许有用、也许毫无关系的错误类别。[…]
所以,至少就我个人而言,我越来越希望问题报告能被压缩成那个人实际观察到的内容:
我运行了这个命令。
我本以为会发生这样的事。
结果却发生了这个。
这里是精确的错误信息或日志。
—— Armin Ronacher,关于提交给 Pi 的 slop issues
最近文章
Datasette Agent - 2026年5月21日
Gemini 3.5 Flash:更贵,但 Google 计划把它用于一切 - 2026年5月19日
LLM 近六个月的发展,用五分钟看完 - 2026年5月19日
这是一段由 Simon Willison 收集的引语,发布于 2026年5月24日。
来源与参考