亚马逊取消被刷分的内部AI排行榜

The Decoder··作者 Maximilian Schreiner

关键信息

该面板跟踪的是亚马逊 Kiro 开发平台上的活动,据报道,一些员工会把 AI 代理指向琐碎任务,只为了提升排名。亚马逊随后改为衡量“normalized deployments”,也就是 AI 生成且真正有用的代码,而不是原始 token 消耗量。

资讯摘要

据《金融时报》报道,亚马逊已经移除了一个内部 AI 排名系统,因为员工把它“刷”坏了。这个系统名为 Kirorank,依据员工在公司 Kiro 开发平台上的活动来打分。结果并没有促进更高效的 AI 使用,反而让一些员工把 AI 代理用在琐碎、无意义的任务上,只为了在排行榜上提高名次。高级副总裁 Dave Treadwell 据称对员工表示:“请不要只为了使用 AI 而使用 AI。

”他还承认,这个面板虽然出发点是好的,但最终带来了额外的云成本。这个时间点对亚马逊来说比较尴尬,因为公司此前设定了一个目标:让超过 80% 的开发者每周都使用 AI,并计划在 2026 年支出约 2000 亿美元,其中大部分用于 AI 基础设施。据称,类似的指标追逐现象也出现在 Meta。亚马逊现在不再看原始 token 消耗,而是改为衡量“normalized deployments”,也就是那些真正有用的 AI 生成代码。

亚马逊取消被刷分的内部AI排行榜

资讯正文

亚马逊在员工用无意义任务“刷分”后取消内部 AI 排行榜

据《金融时报》报道,亚马逊正在撤下一个内部 AI 评级系统,因为员工通过毫无意义的 AI 使用来抬高分数,同时也推高了公司的云计算成本。

这个所谓的“Kirorank”仪表盘,是根据员工在亚马逊 Kiro 开发者平台上的活动表现来打分的。一些员工开始让 AI 代理去处理毫无意义的任务,只为了在排名中往上爬。

据报道,高级副总裁戴夫·特雷德韦尔(Dave Treadwell)对员工表示:“请不要只是为了使用 AI 而使用 AI。”他说,这个仪表盘本意“良好”,但最终却造成了额外成本。

时机颇为尴尬。亚马逊已设定目标,希望超过 80% 的开发人员每周使用 AI,并计划在 2026 年投入约 2000 亿美元,其中大部分将用于 AI 基础设施。Meta 也出现了同样的模式,员工们追逐类似的 AI 使用分数。亚马逊现在追踪的不是原始 token 消耗,而是“normalized deployments”,也就是实际有用的 AI 生成代码。

来源与参考

  1. 原始链接
  2. Amazon kills internal AI leaderboard after employees gamed it with pointless tasks

收录于 2026-05-30