开发者对AI的依赖引发效率担忧
TechCrunch AI··作者 Julie Bort
关键信息
METR 表示,它无法重复之前的“手写代码 vs AI”实验,因为开发者即使只是为了研究也不愿意在没有 AI 的情况下参与。文章还提到 tokenmaxxing、Amazon 和 Uber 的内部成本失控,以及 AI 生成代码可能增加维护负担和修复错误工作的担忧。
资讯摘要
TechCrunch 认为,到 2026 年,AI 编码工具已经深度嵌入开发者的工作流,以至于一些工程师甚至不愿意在没有它们的情况下工作。文章的核心是 METR 这家备受尊重的 AI 研究实验室,它原本想更新一项 2025 年的研究,用来比较开源开发者在手工完成任务和借助 AI 完成任务时分别需要多久。那项早期研究发现,开发者主观上觉得自己在使用 AI 后更高效,但研究人员观察到,AI 实际上让他们更慢,因为他们需要花时间修复错误、引导模型,并等待输出完成。到了 2026 年 2 月,METR 试图重复这项实验时却发现无法招募参与者,因为开发者表示即使只是为了研究,也不愿意在没有 AI 的情况下工作。于是,METR 在 5 月发布了一项调查,让技术员工自行汇报 AI 带来的生产力提升,而受访者普遍认为 AI 让他们对组织的价值翻倍。
文章提醒说,这种自我评估未必可靠,尤其是在 tokenmaxxing 逐渐升温的背景下,也就是把 token 使用量当作生产力指标。文中举例称,Amazon 因员工通过过度使用 AI 代理刷榜而关闭了内部 token 排行榜,Uber 也被报道在年初就花光了 2026 年的 AI 预算,但并没有看到明确的生产力提升。文章还引用了多项关于 AI 生成代码会增加维护和修 bug 成本的说法与研究,包括来自代码审查和可靠性工具厂商的数据,以及新加坡管理大学在 4 月发布的报告,该报告警告 AI 生成代码会给真实软件项目带来长期维护开销。即便是 AI 代理的支持者也承认,目前的系统并不是真正可完全托管的自动化方案,例如 Cognition 首席执行官 Scott Wu 就表示,Devin 目前更像是初级到中级程序员之间的水平,而不是可以彻底放手不管的替代品。

资讯正文
到了 2026 年,研究人员发现,你已经无法把 AI 编程工具从开发者手中那种“铁钳般”的依赖里硬生生拽出来。
不过,尽管 AI 无疑正在帮助程序员更快地产出代码,其他研究人员警告说,它未必正在产出更好的代码。而这可能会在未来给他们带来麻烦。
具体来说,到了 2026 年 2 月,备受尊敬的 AI 研究实验室 METR 发布了一个令人惊讶的发现:如今,大多数开发者已经不愿意在没有 AI 的情况下工作,即便只是面对有限数量的任务。
METR 原本希望对 2025 年几个月前发表的一项开创性 AI 编码生产力研究进行更新。那项研究测量了开源开发者徒手完成任务与借助 AI 完成任务分别需要多少时间。
虽然该研究中的开发者表示,AI 让他们更高效,但他们震惊地发现,AI 实际上让他们更慢了。没错,它生成代码更快,但随后他们还要花额外时间寻找和修复错误、引导 AI,以及等待它完成任务。
当 METR 着手重复这一实验,以衡量 AI 和程序员熟练度的进展时,他们做不到。
研究人员坦言,开发者不愿参与,“因为他们不想在没有 AI 的情况下工作”,哪怕只是为了这项研究。
于是,METR 在 5 月发布了一项调查,让技术员工自行报告他们在 AI 生产力方面的收益。不出所料,他们认为 AI 让他们对各自组织的价值提高了一倍。
但近期关于所谓 tokenmaxxing 的惊人开销的头条新闻,再加上一些最新研究,使这种自我认知显得可疑。
到目前为止,tokenmaxxing——也就是用一个人消耗的 token 数量来作为其借助 AI 工作生产力的代理指标——一直是 2026 年的潮流。但它或许已经快要走到头了。
《金融时报》本周报道称,亚马逊在员工过度使用 AI 智能体、并因此推高成本后,关闭了内部的 token 跟踪排行榜 Kirorank。员工们证明,使用 AI 并不会自动转化为更高的生产力。
The Information 报道称,Uber 在 2026 年的 AI 预算在今年前四个月就已经耗尽。首席运营官 Andrew Macdonald 最近在一档播客中表示,这样的支出并没有带来可衡量的项目增长或生产力提升。
程序员兼作者 James Shore 在一篇 Hacker News 上爆红的博客文章中优雅地论证说,AI 生成的代码也未必能减少持续的代码维护需求,甚至可能让维护成本上升。
“你现在写代码快了一倍?那最好希望你的维护成本也减半了,”他写道。“否则你就完了。你是在用短暂的速度提升,换取永久的役使。”
还有其他证据表明,AI 可能会加剧代码维护方面的麻烦。
可靠性工程智能体初创公司 Entelligence AI 的创始人兼 CEO Aiswarya Sankar 发布的一条病毒式传播的推文称,公司有 44% 的 token 都花在了修复 AI 生成的 bug 上。与此同时,代码审查工具公司 CodeRabbit 表示,它分析了开源 pull request,并发现 AI 产生的问题数量是人工代码的 1.7 倍。
这些统计数据,坦白说,带有明显的自利色彩,出自那些想要兜售 AI 代码审查工具的人。
不过,独立研究人员也发现了这类问题。备受尊敬的新加坡管理大学的研究人员在 4 月发布的一份报告中警告称,“AI 生成的代码会给真实的软件项目带来长期的维护成本。”
既然程序员如此喜欢他们的 AI 助手,那解决方案是什么?
嗯,那些想把 AI 编码代理卖给你的人表示,开发者完全可以用 AI 编码代理来完成修复代码这种令人疲惫不堪的任务,速度和 AI 生成代码一样快。Cognition 创始人兼首席执行官 Scott Wu——AI 编码代理 Devin 的开发者——就是这么建议的。
但即便是他也承认,虽然 Devin 可以独立工作,但如果按任务来算,他目前会把它的水平评为介于初级和中级程序员之间。这并不是一种“交出去就不用管了”的解决方案。
SMU 的研究人员则提出了一种更偏向人类的办法。程序员应该像熟悉自己最喜欢的编程语言一样,深入了解 AI 擅长做什么、不擅长做什么。他们需要为 AI 设计强大的质量保证系统,并且不得不像审查一名初级开发者的工作一样,仔细检查 AI 的成果。
与此同时,研究人员表示(Wu 也同意这一点),人类仍然应该负责软件架构和安全设计这类更宏观的工作。
来源与参考
收录于 2026-05-31