AI 代币成本引发行业反弹

TechCrunch AI··作者 Rebecca Bellan

关键信息

文中举例称,Uber 在 4 月就用光了 2026 年 AI 编程预算,Microsoft 撤销了 Claude Code 许可证,而 Priceline 员工则表示 Cursor 续约报价上涨了 4 到 5 倍。文章还引用 Faros AI 和 Jellyfish 的研究,指出最“烧 token”的工程师可能更高产,但 token 消耗也高得多,而且最终业务回报并不清晰。

资讯摘要

TechCrunch 表示,AI 成本问题已经从理论争论变成了各家公司日常预算中的现实压力。2025 年初大量企业冲进高配 AI 订阅方案,如今却发现实际使用量远超预期,尤其是 autonomous 和 agentic 工具会消耗比普通聊天更多的 token。文中提到,Uber 据称在 4 月就花光了整个 2026 年的 AI 编程预算,Microsoft 在最初开放 Claude Code 后又撤回了相关许可,而 Priceline 员工则表示一次常规的 Cursor 续约报价竟然贵了 4 到 5 倍。文章指出,虽然单个 token 的价格下降了,但由于公司更激进地使用 AI、并让模型承担更多工作,总账单仍在持续上升。

OpenAI 企业负责人 Alexander Embiricos 表示,客户现在不再主要问模型“好不好用”,而是更关心支出可见性、可审计性、token 控制以及模型效率。作为回应,Linux Foundation 正在成立 Tokenomics Foundation,希望像 FinOps 之于云基础设施那样,为 AI 支出建立标准化和成本纪律。FinOps Foundation 负责人 J.R. Storment 说,很多公司到春天就已经超出全年 token 预算数倍,大家的讨论也从“快点用起来”转向“我们有哪些护栏”。文章最后强调,市场正在加速推出工具和标准,因为企业需要在费用继续失控之前,先把 AI 使用量测出来、管起来,并证明它到底值不值。

AI 代币成本引发行业反弹

资讯正文

整个行业里,企业开始对 AI 的价格感到吃不消。Uber 在 4 月就已经把 2026 年的 AI 编程预算全部花光。微软在让开发者使用 Claude Code 几个月后,又撤销了这些许可。Priceline 的一名员工告诉 TechCrunch,一份例行的 Cursor 合同续约报价比原来贵了 4 到 5 倍。

尽管按 token 计价的单价已经下降,但推动更多 AI 落地以及越来越自主的智能体,正让 token 消耗不断攀升。那些在 2025 年初沉迷于“自助餐式”订阅的公司,如今正忙着弄清钱都花到哪里去了、收缩开支,并试图判断自己能否从预算的废墟中挽回一些投资回报。

与此同时,市场也在朝着这个需求方向形成。初创公司、成熟供应商以及一个新的标准化机构,都在竞相为企业提供工具和术语,帮助它们追踪支出。

OpenAI 企业业务负责人 Alexander Embiricos 本周在纽约市一场活动上告诉 TechCrunch:“六个月前,我和客户谈话时,讨论的全都是‘它能做什么?够好吗?’。现在我们的对话从来不是这些。现在谈的都是,‘嘿,我们花得太多了。你们能提供什么可视性?你们能提供什么审计能力?你们能提供什么 token 控制?你们模型的效率如何?’”

正是在这样的背景下,Linux Foundation 本周宣布计划成立 Tokenomics Foundation,这是一个新的标准化机构,目标是像 FinOps 之于云支出那样,为 AI token 建立同样的成本纪律。

Linux Foundation 旗下 FinOps Foundation 的执行董事 J.R. Storment 告诉 TechCrunch:“在 4 月和 5 月,我开始从一些公司那里听到:‘天哪,我们到 4 月就已经超出整个 2026 年 token 预算的 3 倍了。’我们开始听到各种生存危机式的说法,整个讨论也从 tokenmaxxing 和‘快速推进’转向了‘我们需要护栏,我们该怎么控制这个?’”

整个科技圈听到的这些呼声,源于 CEO 们强烈要求团队使用最好的模型并尽快推进,至于成本则无所谓。Anthropic 的 Claude Opus 4.5、OpenAI 的 GPT-5.1 以及 Google 的 Gemini 3 Pro 等 11 月发布的新模型,显著提升了 agentic 工具的能力,也使 token 消耗成倍增长。据称,某家公司甚至因为忘了给员工设置使用上限,最后收到了一张 5 亿美元的 Claude 账单。

Priceline 的 IT 财务高级总监 Chris Reed 说:“这就像 crack-cocaine 流行病。”他指出,公司已经开始对某些群体设定 token 限额。“他们先让你试用,好让你上瘾,然后你就有点离不开它了。”

工程运营平台 Faros AI 的首席执行官 Vitaly Gordon 说,他最近和一位 CTO 谈过,对方告诉他:“我有个工程师上个月花了 4 万美元买 token,说实话,我真不知道我是该把他停掉,还是该去告诉所有人都学他那样。”

Faros 在 4 月发布的一项对 2 万名开发者的两年研究发现,产出在上升,但 bug 和重写也在增加。工程管理平台 Jellyfish 也发现,使用最多 token 的工程师,其生产力大约是较少使用 AI 的工程师的两倍,但他们为此消耗的 token 数量却高出 10 倍。

Jellyfish 研究负责人 Nicholas Arcolano 通过电子邮件告诉 TechCrunch,AI 支出之所以迅速膨胀,很大程度上是因为 agentic 功能,每位开发者的消耗在 9 个月内增长了约 18.6 倍。总的来说,这些数据让“生产力是否足以证明支出合理”这件事,比账单本身看起来要更加扑朔迷离。

Arcolano 说:“极端支出是否值得,取决于最终交付代码的业务价值(例如收入),而大多数公司仍然无法衡量这一点。”

至少有一部分衡量难题,来自 AI 当下被使用的规模之大。

Storment 说:“追踪云成本是一个每月涉及数亿行数据的问题。追踪 token 成本则是一个每月涉及数万亿行数据的问题。你不能把它直接塞进某个电子表格,甚至不能塞进一个基础工具。你必须从根本上重新思考你的工具、规范以及会计系统,才能做到这一点。”

在 Priceline,Reed 已经看到了差异。他提到,供应商报告的使用量与 Priceline 的内部数据之间存在问题。

他说:“我职业生涯一开始是在电信费用管理领域工作,而我现在看到的和当年所有相同的相似之处,从电信到云再到 AI 都是如此。每当你引入新东西,就很容易出现计费错误,也会带来审计和优化机会。”

围绕这一问题,一个市场已经开始形成。有一些纯粹做这件事的公司,比如 Pay-i,它用于跟踪、衡量并优化 GenAI 投资的成本和表现。与此同时,Paid 允许开发者追踪成本、衡量使用情况,并根据实际价值而不是订阅费用向用户计费。

还有像 Jellyfish、Waydev 和 Faros AI 这样的公司,它们都提供 AI agent 监控,以证明开发者工具的投资回报率。Storment 表示,FinOps Foundation 旗下 180 家供应商中,大多数都正朝着这个方向倾斜。

那些已经拥有现有分发渠道的公司也在增加新功能,以利用这个新市场。Ramp 最近已进入 AI 支出管理领域;Datadog 和 New Relic 也附加了云成本管理、token 级可观测性以及 GPU 监控等服务。在下周的 FinOps X 大会上,AWS 预计将推出面向企业 AI 支出的新财务管理功能。

NEA 合伙人 Tiffany Luck 认为,token 效率和可观测性很可能会被加入到“harness 或应用层”中。她提到了 Factory,这是一家为企业打造 AI agent 的初创公司,本周该公司推出了一个模型路由器,可为每项任务自动选择合适的模型。

Gordon 预计,前沿实验室和其他模型提供商将采用类似 OpenRouter 的优化方式,把查询导向最便宜的模型——这一趋势已经开始出现在企业 Claude 账单上。

“关于你在 Anthropic 上花了多少钱的财务报告,即使你调用的是 Opus 模型,部分支出也会落在 Sonnet 或 Haiku 上,因为它们足够聪明,能够完成这件事,”Gordon 说。“我认为这会越来越成为一种常态。”

但所有这些工具的构建都没有一个共同语言,也没有共享的定义来说明一个 token 多少钱、它产生什么,以及如何在不同供应商之间比较支出。这正是 Tokenomics Foundation 希望发挥作用的地方。

该基金会正在构建“tokenomics”的规范性定义和框架;为 AI token 使用和计费制定开放标准、规范和指标;以及用于 AI 经济学的新指标,例如每单位智能成本(cost-per-intelligence)或每瓦 token 数(tokens-per-watt)。它还计划定义涵盖 token 工厂有效性和消费效率的指标。该组织计划于 7 月正式启动,并将在下周的 FinOps X 大会上宣布更多成员。

Salesforce 首席可用性官 Nishant Gupta 在一份声明中表示:“Token 经济学在本质上比我们以如此规模处理过的任何事物都更加抽象和不透明。它需要一种不同的运营能力,而不是这个行业为云计算建立起来的那套能力。”

话虽如此,高盛预计,到 2030 年全球 token 使用量将增长 24 倍。那些已经超支的公司现在就需要解决方案,而该基金会的首个交付成果仍要数月后才能推出。

Gordon 说:“也许我们造出了一台蒸汽机,但我们还没想明白装配线。”

据 Arcolano 称,明智的做法是广泛而适度的采用。

他说:“最好的投资回报来自把广大的中间群体从低使用量提升到中等使用量,而不是把重度用户再往上推。”

Russell Brandom 和 Tim Fernholz 对本报道有贡献。

来源与参考

  1. 原始链接
  2. The token bill comes due: Inside the industry scramble to manage AI’s runaway costs | TechCrunch

收录于 2026-06-06