AI公司因成本上升转向付费模式
The Verge AI··作者 Hayden Field
关键信息
高盛估计到2029年AI数据中心投资将达到6.3万亿美元,企业若想避免资产减值,至少需要获得7%的资本回报率——这要求累计收入接近7万亿美元。
资讯摘要
Anthropic和OpenAI等领先AI公司因成本上升和投资者期望而收紧了对第三方工具的模型访问权限。Anthropic最近对OpenClaw的限制是这一趋势的典型例子,现在高用量需付费。这些变化反映了从补贴增长向盈利模式的广泛转变,类似于2010年代科技泡沫时期的做法。
投资者已投入数千亿美元用于AI基础设施,期望获得强劲回报。分析师警告称,若无法实现显著收入(到2029年可能高达8.2万亿美元),公司可能失去投资者信心甚至面临资产减值。

资讯正文
你即将感受到AI带来的资金压力
本月早些时候,数百万OpenClaw用户醒来后发现了一项广泛实施的指令:今年席卷全球科技行业的病毒式AI代理工具,已被Anthropic大幅限制。
Anthropic和其他领先的AI实验室一样,面临着巨大压力,必须减轻系统负担并开始盈利。因此,如果用户希望使用Claude AI来驱动他们流行的代理工具,就必须为此付出高昂的费用。
Claude Code负责人Boris Cherny在X平台上写道:“我们的订阅服务并非为这些第三方工具的使用模式而设计。我们希望有意识地管理增长,以长期可持续地服务客户。这一变化是迈向该目标的一步。”
这一公告标志着时代的变迁。投资者已向OpenAI和Anthropic等公司投入数千亿美元,帮助它们扩大规模并建设计算基础设施。现在,他们期待回报。经过多年提供廉价甚至免费的高级AI访问权限之后,账单终于开始到来——而下游用户已经开始感受到压力。
过去几年中,大多数顶级AI实验室都推出了新的订阅层级,以吸引高需求用户。OpenAI和Anthropic调整了企业级定价方案;OpenAI引入了平台内广告;Anthropic则限制了第三方工具的使用。
从某种意义上说,这是一则老生常谈的故事,尤其与2010年代的技术繁荣如出一辙。风险投资家曾帮助初创企业补贴多个领域的快速增长:网约车应用、电子商务、外卖和生鲜配送。一旦公司确立市场主导地位,它们就会提价、增加新的收入来源,并向投资者兑现回报。或者,它们不会这么做,最终失败倒闭。
但AI公司近年来吸收的投资速度远超历史上任何其他行业。AI公司已在世界各地建设数据中心,投入数十亿美元,承诺打造更优模型、降低成本,并实现人人可用的AI。即便只是遏制亏损也已十分困难——更别说赚取投资者所期望的巨额利润了。“当你向数据中心投入数万亿资金时,自然会期待回报,”研究生成式AI长期经济趋势的Gartner高级总监威尔·索默(Will Sommer)表示,他专长于经济预测和量化建模。
佐治亚理工学院交互计算学院教授马克·里德尔(Mark Riedl)说:“基本上免费或接近免费的AI时代是否正在结束?现在下结论还为时过早,但已有迹象表明这一点。”
Gartner的索默专注于研究生成式AI相关的长期经济市场趋势,包括估算其中涉及的资金规模。他说,预计到2029年,全球对AI数据中心的资本投资将达到约6.3万亿美元——“这是一笔巨额资金。”
为了避免这些资产减值,大型人工智能模型提供商理想情况下需要实现约25%的投资资本回报率(ROIC)——索默指出,这大约是亚马逊、微软和谷歌在其整体资本投资上通常获得的回报率。另一方面,如果回报低于12%,机构资本就会失去兴趣,因为其他地方有更赚钱的机会;而一旦低于7%,就进入了减值区间,索默称这将对这项技术的所有投资者来说都是一场‘无法挽回的灾难’。
为了达到最低的7%门槛,高德纳(Gartner)预测,大型AI公司到2029年累计需通过AI驱动的收入赚取接近7万亿美元,即到该时期末每年约2万亿美元。若要实现‘历史级回报’,则需在同一时期内赚取近8.2万亿美元。
OpenAI在2月表示,其已承诺到2030年支出6000亿美元,索默称这已经是相比此前计划的1.4万亿美元大幅下调。根据OpenAI的收入预测及潜在复合年增长率,索默表示,即使在最乐观的情况下,他也预测这家实验室只能实现所需支出的一小部分,以达到7%的ROIC。
像OpenAI这样的模型提供商如何赚钱?他们通过销售所谓的‘令牌’(tokens)来实现。一个令牌本质上是一个AI模型可以理解并处理的数据单元,可能是文本、图像、音频或其他内容。一般来说,一个令牌相当于英文中的四个字符——例如,“bathroom”这个词很可能被处理为两个令牌。据OpenAI估算,一段英文文字大约为100个令牌,一篇1500词的文章可能约为2050个令牌。
索默指出,为了满足投资者的收入预期,提供商必须处理数量惊人的令牌。
从多数指标来看,企业目前的数据已经相当庞大。比如谷歌曾在10月份宣布其处理了1.3千万亿个令牌。如果把所有提供商的估算加总起来,索默称,每年大约有100到200千万亿个令牌。但要实现高德纳计算出的每年2万亿美元支出目标,按照保守估计,提供商每年需生成累计达10万亿个令牌。(为了让这个数字更具体一些:一千万亿有15个零,一万亿有21个零。)即便假设每个令牌的利润率非常慷慨地达到10%,这意味着从现在到2030年之间,令牌消耗量的增长幅度也必须达到5万倍至10万倍。
你即将感受到AI带来的资金压力
目前,企业不断寻求更多数据中心,但计算资源却十分紧张,无法处理如此多的令牌(tokens)。即使它们能够做到这一点,也会面临另一个问题:很可能在这些令牌上亏损。Sommer估计,如果仅计算基础设施和电力的直接成本,“每家公司都能在每个令牌上获得相当合理的利润率”。但随着更耗能的新模型出现,这种利润空间可能变得更窄甚至消失。间接运营成本,比如建设更多算力以及不断训练下一代大模型的‘骇人听闻’支出,会完全吞噬掉这部分利润。
“一旦你再加上为下一代模型所需构建的所有基础设施,并考虑这些模型将如何扩展,情况就会变得越来越不可持续,”Sommer表示。
Sommer预测,许多公司“将无法维持当前的烧钱速度”,并认为市场整合几乎是不可避免的——在他看来,任何区域市场最多只能存活两家大型语言模型提供商。而过去几乎每个服务都提供相对慷慨的免费层级的时代,可能也不会再持续下去了。
法律AI初创公司Eve的联合创始人Jay Madheswaran告诉《连线》杂志:“对于那些拥有大量免费用户的实验室来说,问题从来不是是否要对免费层进行变现,而是何时以及以何种方式变现。”
即使你能解决这个财务难题,建立客户忠诚度也同样复杂。顶级实验室之间不断在模型发布、功能更新、战略调整、招聘公告等方面互相超越。很难长期保持领先地位来占领市场的一部分——工程师和开发者以频繁更换所用模型闻名,而且切换起来非常容易。
因此,实验室越来越强调锁定用户及其平台工具的重要性。主要面向企业客户的Anthropic正在全力投入编码工作,而OpenAI最近也承诺将效仿Anthropic,聚焦于编码和企业级应用,这两大公司据传正竞相争取在2026年底前上市。
目前,这种竞争对终端用户是有利的。Wisdom AI的联合创始人兼CEO Soham Mazumdar表示:“这是一个不能稍有松懈的军备竞赛,因为切换成本为零。”他还补充道,“作为一个普通人,我最终会是赢家。”
在AI早期阶段,大部分计算成本集中在训练初始模型上,而推理(即执行任务)则相对便宜。然而随着模型进步和系统功能增加,推理现在变得更为资源密集。AI代理(或称智能体),即理想情况下能在无需持续干预的情况下完成复杂多步骤任务的工具,如今使用的令牌数量远超几年前的基础聊天机器人模型。
你即将感受到AI带来的成本压力
佐治亚理工学院的里德尔表示,推理模型——这些模型正越来越多地为AI代理提供动力——在推理阶段也以昂贵著称。这些代理,比如流行的开源平台OpenClaw,通常比没有推理能力的代理更高效、更有效,但它们也会在用户看不见的后台工作中消耗大量令牌(tokens)。这可能表现为“思考”许多不同的潜在路径,启动子代理来完成任务的部分内容,或验证流程中不同步骤的准确性。
里德尔说:“你输入一个句子的提示……它会自己大声‘说话’成千上万的令牌,甚至成千上万的文字,当你进入编程时,可能会达到数万。”他补充道,“如果你每天有成千上万甚至数百万用户使用这些工具,那么用户持续生成海量令牌所带来的推理成本,远远超过训练阶段的成本。”如果模型提供商能从每个令牌中直接获利,并且拥有充足的计算资源轻松处理这些负载,这对他们来说就不是问题;但现实情况是,这已经成了负。
Box公司CEO Aaron Levie表示:“过去几年里构建代理的人其实早就预见到这一点了。用例激增,我们已超出容量。”
最近,顶级AI实验室已调整了API使用和第三方工具的政策——例如Anthropic几乎禁止非付费订阅者使用OpenClaw,原因是这种额外负载造成的压力。“你看到这些工具就像放在每个人笔记本电脑和台式机上的后台处理器,不断唤醒自己,生成一些令牌,做点事情,然后再回去睡觉,”里德尔说道。
无论你如何使用基于推理模型的AI代理,都可能产生浪费的令牌——也就是说,AI模型走了一条无用的路径然后回溯,或者检查某个步骤进展却并未改变任何东西,甚至停下来给自己写一首诗。在一个实验室可能对某些令牌亏损、企业又缺乏计算资源的时代,整个行业正在努力减少浪费的令牌,并开发更加专注和精准的模型。
虽然让模型使用更少令牌对付费客户和AI实验室都有好处,但从某种意义上说,这反而违背了大幅增加令牌使用的初衷。正如Gartner的索默所说,定价模式未来可能会发生显著变化,但目前,短期和长期目标之间存在一个‘狭窄的 treadmill 空间’。
你即将感受到AI带来的资金压力。
大公司们正处在转型的十字路口:它们曾通过免费访问吸引大量用户,现在却需要在提高收费的同时留住这些用户。‘一方面,他们希望看到更多token被生成,但必须承担成本——只要风险投资还在流入,他们还能勉强承受,或者把成本转嫁给客户,’里德尔回应道。‘也许目前的经济逻辑有点颠倒了。’
如今,OpenAI和Anthropic经常在权衡旧式固定订阅计划与按用量计费方案之间的优劣。两家公司的企业级计划现在都基于token计费,正如Zencoder创始人安德鲁·菲尔夫所称,这是因为用户使用情况‘不均衡’——有人每周只用一两次,每次几分钟;而另一些人则全天候运行五个代理程序。
在消费级聊天机器人领域,一些模型开发者正尝试通过广告来缓解这一问题。OpenAI最近在ChatGPT中引入了广告,以独立侧边栏的形式展示,并据报道正在开发一个工具来追踪这些广告的效果。(Anthropic曾在2026年超级碗广告中烈批评过这项举措。)
但对于那些基于GPT-5或Claude Opus等模型构建工具的公司而言,token价格正在上涨,额外成本大多会传导到它们的客户身上。《韦尔奇》采访的多家科技公司表示,他们或他们的客户正在调整策略以应对新定价。有些公司考虑完全或部分转向开源模型,还有一些则投入大量时间和资源评估高端模型在特定任务上的表现是否优于更便宜的替代方案。
软件公司Anaconda的CEO大卫·德桑托最近结束了一次为期五周的全球客户巡讲。他表示,许多客户正在转向自托管AI模型——将自家模型部署在Amazon Bedrock或Google Vertex AI上,以便更好地控制供应链——或者为大部分需求改用开源或开放权重模型,因为近期许多此类模型在基准测试中的表现已显著提升。他还提到,一些公司还担心向商业前沿实验室发送知识产权的安全性问题,因此仅将ChatGPT或Claude模型用于‘关键任务应用’。
‘我遇到的所有人都面临类似的问题——他们的token使用量增加了,因此基于用量的账单费用也上升了,或者他们原先所在的层级不再有相同的上限,现在不得不升级到更昂贵的层级,才能维持每月相同水平的使用量,从而保持原有的固定费率。’德桑托说。
销售软件给原告律师的公司Eve一直在平衡质量和token成本,马德赫斯瓦兰表示,特别是因为Eve的token使用量至今已同比激增100倍。因此,它不断在开源模型、Anthropic和OpenAI的不同模型之间切换。
但Madheswaran表示,即使输出质量下降1%,也会对Eve的客户产生‘相当显著’的影响,这也是为什么Eve投入大量内部资源来追踪模型质量。公司通常会将较新的、更昂贵的推理模型用于约25%至30%的场景,其余使用则在Eve自研的开源版本和来自领先实验室的小型、廉价模型之间分配。Madheswaran称,他们发现某些廉价模型在特定查询下与昂贵模型一样准确。
“开源真正起到的作用是,它迫使这些公司让它们的廉价模型变得更便宜,因为那里的利润空间要大得多,”Madheswaran说。
提供AI驱动数据分析的Wisdom AI目前尚未被迫转嫁成本上涨。团队正在测试不同模型在不同类型任务上的表现,并据此制定预算。Mazumdar表示,他们最近一直在测试Cerebras模型——这种模型因开放权重而流行——以应对像OpenAI和Anthropic这样的顶级实验室未来可能带来的价格上涨。“大型AI公司之前一直免费提供服务,”Mazumdar说,“他们的策略是,一旦察觉到有企业用户或付费意愿,就会立刻大幅涨价。”
但他指出,成本始终存在,尤其是在编码领域。“现实情况是:如果你要做任何类型的编程,开源模型根本无法匹敌,这就是我们今天不得不面对的无奈现状,”他说。
Box公司的Levie认为,这些变化将在未来24个月内逐步显现。他表示,VC补贴时代的AI或许对增长必不可少——毕竟,如果两家产品基本相同的企业争夺同一群客户,其中一家以更低价格(补贴价)提供服务,那么短期内后者显然会胜出。但现在是时候提高系统的效率了,不是所有企业都能挺过这一轮。
“市场的规模如此之大,我认为最终一切都会顺利解决,”Levie说,“但从单个公司层面来看,你必须决定:能否跟上这个飞轮效应?还是因为融资困难或无法优化模型以适应自身任务而被市场淘汰?”
Eve的Madheswaran认为,行业很快将从关注所谓‘最佳’模型转向寻找最适合企业个性化、细分应用场景的解决方案。“这是我自己的判断,当然,我也把整个公司押注在这个方向上。”
Gartner的Sommer将整个局面比作他所谓的‘剑龙悖论’。他说,科学家最初发现剑龙化石时,不明白这么庞大的身躯如何由如此小的头部和微小的嘴巴支撑——他们当时提出的理论是,剑龙必须不断进食,并且需要营养极高的饮食才能维持生存。
“我们认为AI的情况也差不多,”索默说,“为了让这只剑龙(AI实验室)存活下来,提供者需要为它找到更多食物(整个全球经济,而不仅仅是科技市场),而且这些食物还必须营养丰富(也就是说,提供者需要从中获利,而不是持续补贴)。如果剑龙悖论得不到解决,嘴太小而身体太大,”他说,“就会导致资产减值、估值下跌、融资枯竭,并在全球范围内重新设定对AI的预期。
因此,索默表示,一个可持续的商业模式“要求生成式AI被融入从广告牌到结账终端的方方面面”,提供者从所有这些交易中抽取分成。
“免费时代实际上是一场土地争夺战——这是初创公司常用的策略,”艾芙的马德赫斯瓦兰说,“但这并不是一种可行的商业模式。你不能长期这样做。”
来源与参考
收录于 2026-04-24