亚马逊取消被刷分的内部AI排行榜
The Decoder··作者 Maximilian Schreiner
关键信息
该面板跟踪的是亚马逊 Kiro 开发平台上的活动,据报道,一些员工会把 AI 代理指向琐碎任务,只为了提升排名。亚马逊随后改为衡量“normalized deployments”,也就是 AI 生成且真正有用的代码,而不是原始 token 消耗量。
资讯摘要
据《金融时报》报道,亚马逊已经移除了一个内部 AI 排名系统,因为员工把它“刷”坏了。这个系统名为 Kirorank,依据员工在公司 Kiro 开发平台上的活动来打分。结果并没有促进更高效的 AI 使用,反而让一些员工把 AI 代理用在琐碎、无意义的任务上,只为了在排行榜上提高名次。高级副总裁 Dave Treadwell 据称对员工表示:“请不要只为了使用 AI 而使用 AI。
”他还承认,这个面板虽然出发点是好的,但最终带来了额外的云成本。这个时间点对亚马逊来说比较尴尬,因为公司此前设定了一个目标:让超过 80% 的开发者每周都使用 AI,并计划在 2026 年支出约 2000 亿美元,其中大部分用于 AI 基础设施。据称,类似的指标追逐现象也出现在 Meta。亚马逊现在不再看原始 token 消耗,而是改为衡量“normalized deployments”,也就是那些真正有用的 AI 生成代码。

资讯正文
亚马逊在员工用无意义任务“刷分”后取消内部 AI 排行榜
据《金融时报》报道,亚马逊正在撤下一个内部 AI 评级系统,因为员工通过毫无意义的 AI 使用来抬高分数,同时也推高了公司的云计算成本。
这个所谓的“Kirorank”仪表盘,是根据员工在亚马逊 Kiro 开发者平台上的活动表现来打分的。一些员工开始让 AI 代理去处理毫无意义的任务,只为了在排名中往上爬。
据报道,高级副总裁戴夫·特雷德韦尔(Dave Treadwell)对员工表示:“请不要只是为了使用 AI 而使用 AI。”他说,这个仪表盘本意“良好”,但最终却造成了额外成本。
时机颇为尴尬。亚马逊已设定目标,希望超过 80% 的开发人员每周使用 AI,并计划在 2026 年投入约 2000 亿美元,其中大部分将用于 AI 基础设施。Meta 也出现了同样的模式,员工们追逐类似的 AI 使用分数。亚马逊现在追踪的不是原始 token 消耗,而是“normalized deployments”,也就是实际有用的 AI 生成代码。
来源与参考
收录于 2026-05-30