开发者对AI的依赖引发效率担忧

TechCrunch AI·5月30日 06:14 UTC·作者 Julie Bort

关键信息

METR 表示，它无法重复之前的“手写代码 vs AI”实验，因为开发者即使只是为了研究也不愿意在没有 AI 的情况下参与。文章还提到 tokenmaxxing、Amazon 和 Uber 的内部成本失控，以及 AI 生成代码可能增加维护负担和修复错误工作的担忧。

资讯摘要

TechCrunch 认为，到 2026 年，AI 编码工具已经深度嵌入开发者的工作流，以至于一些工程师甚至不愿意在没有它们的情况下工作。文章的核心是 METR 这家备受尊重的 AI 研究实验室，它原本想更新一项 2025 年的研究，用来比较开源开发者在手工完成任务和借助 AI 完成任务时分别需要多久。那项早期研究发现，开发者主观上觉得自己在使用 AI 后更高效，但研究人员观察到，AI 实际上让他们更慢，因为他们需要花时间修复错误、引导模型，并等待输出完成。到了 2026 年 2 月，METR 试图重复这项实验时却发现无法招募参与者，因为开发者表示即使只是为了研究，也不愿意在没有 AI 的情况下工作。于是，METR 在 5 月发布了一项调查，让技术员工自行汇报 AI 带来的生产力提升，而受访者普遍认为 AI 让他们对组织的价值翻倍。

文章提醒说，这种自我评估未必可靠，尤其是在 tokenmaxxing 逐渐升温的背景下，也就是把 token 使用量当作生产力指标。文中举例称，Amazon 因员工通过过度使用 AI 代理刷榜而关闭了内部 token 排行榜，Uber 也被报道在年初就花光了 2026 年的 AI 预算，但并没有看到明确的生产力提升。文章还引用了多项关于 AI 生成代码会增加维护和修 bug 成本的说法与研究，包括来自代码审查和可靠性工具厂商的数据，以及新加坡管理大学在 4 月发布的报告，该报告警告 AI 生成代码会给真实软件项目带来长期维护开销。即便是 AI 代理的支持者也承认，目前的系统并不是真正可完全托管的自动化方案，例如 Cognition 首席执行官 Scott Wu 就表示，Devin 目前更像是初级到中级程序员之间的水平，而不是可以彻底放手不管的替代品。

资讯正文

到了 2026 年，研究人员发现，你已经无法把 AI 编程工具从开发者手中那种“铁钳般”的依赖里硬生生拽出来。

不过，尽管 AI 无疑正在帮助程序员更快地产出代码，其他研究人员警告说，它未必正在产出更好的代码。而这可能会在未来给他们带来麻烦。

具体来说，到了 2026 年 2 月，备受尊敬的 AI 研究实验室 METR 发布了一个令人惊讶的发现：如今，大多数开发者已经不愿意在没有 AI 的情况下工作，即便只是面对有限数量的任务。

METR 原本希望对 2025 年几个月前发表的一项开创性 AI 编码生产力研究进行更新。那项研究测量了开源开发者徒手完成任务与借助 AI 完成任务分别需要多少时间。

虽然该研究中的开发者表示，AI 让他们更高效，但他们震惊地发现，AI 实际上让他们更慢了。没错，它生成代码更快，但随后他们还要花额外时间寻找和修复错误、引导 AI，以及等待它完成任务。

当 METR 着手重复这一实验，以衡量 AI 和程序员熟练度的进展时，他们做不到。

研究人员坦言，开发者不愿参与，“因为他们不想在没有 AI 的情况下工作”，哪怕只是为了这项研究。

于是，METR 在 5 月发布了一项调查，让技术员工自行报告他们在 AI 生产力方面的收益。不出所料，他们认为 AI 让他们对各自组织的价值提高了一倍。

但近期关于所谓 tokenmaxxing 的惊人开销的头条新闻，再加上一些最新研究，使这种自我认知显得可疑。

到目前为止，tokenmaxxing——也就是用一个人消耗的 token 数量来作为其借助 AI 工作生产力的代理指标——一直是 2026 年的潮流。但它或许已经快要走到头了。

《金融时报》本周报道称，亚马逊在员工过度使用 AI 智能体、并因此推高成本后，关闭了内部的 token 跟踪排行榜 Kirorank。员工们证明，使用 AI 并不会自动转化为更高的生产力。

The Information 报道称，Uber 在 2026 年的 AI 预算在今年前四个月就已经耗尽。首席运营官 Andrew Macdonald 最近在一档播客中表示，这样的支出并没有带来可衡量的项目增长或生产力提升。

程序员兼作者 James Shore 在一篇 Hacker News 上爆红的博客文章中优雅地论证说，AI 生成的代码也未必能减少持续的代码维护需求，甚至可能让维护成本上升。

“你现在写代码快了一倍？那最好希望你的维护成本也减半了，”他写道。“否则你就完了。你是在用短暂的速度提升，换取永久的役使。”

还有其他证据表明，AI 可能会加剧代码维护方面的麻烦。

可靠性工程智能体初创公司 Entelligence AI 的创始人兼 CEO Aiswarya Sankar 发布的一条病毒式传播的推文称，公司有 44% 的 token 都花在了修复 AI 生成的 bug 上。与此同时，代码审查工具公司 CodeRabbit 表示，它分析了开源 pull request，并发现 AI 产生的问题数量是人工代码的 1.7 倍。

这些统计数据，坦白说，带有明显的自利色彩，出自那些想要兜售 AI 代码审查工具的人。

不过，独立研究人员也发现了这类问题。备受尊敬的新加坡管理大学的研究人员在 4 月发布的一份报告中警告称，“AI 生成的代码会给真实的软件项目带来长期的维护成本。”

既然程序员如此喜欢他们的 AI 助手，那解决方案是什么？

嗯，那些想把 AI 编码代理卖给你的人表示，开发者完全可以用 AI 编码代理来完成修复代码这种令人疲惫不堪的任务，速度和 AI 生成代码一样快。Cognition 创始人兼首席执行官 Scott Wu——AI 编码代理 Devin 的开发者——就是这么建议的。

但即便是他也承认，虽然 Devin 可以独立工作，但如果按任务来算，他目前会把它的水平评为介于初级和中级程序员之间。这并不是一种“交出去就不用管了”的解决方案。

SMU 的研究人员则提出了一种更偏向人类的办法。程序员应该像熟悉自己最喜欢的编程语言一样，深入了解 AI 擅长做什么、不擅长做什么。他们需要为 AI 设计强大的质量保证系统，并且不得不像审查一名初级开发者的工作一样，仔细检查 AI 的成果。

与此同时，研究人员表示（Wu 也同意这一点），人类仍然应该负责软件架构和安全设计这类更宏观的工作。

来源与参考

收录于 2026-05-31