人工智能行业因GPU价格上涨面临算力短缺

The Decoder··作者 Maximilian Schreiner

关键信息

Anthropic的API可用性降至98.95%(低于行业标准99.99%),而OpenAI的每分钟token使用量从10月的60亿增长到3月的150亿。摩根士丹利预计供应将至少到2029年都跟不上需求。

资讯摘要

人工智能行业正面临严重的算力短缺,原因是代理型AI(自主执行任务的工具)的爆炸式增长。这导致Anthropic频繁断电,企业客户因可用性差(98.95%)而流失。OpenAI为此关闭了Sora视频应用,将资源转向编码和企业模型。

GPU价格飙升48%,GitHub、OpenAI和Anthropic等公司已引入新限制、配额和定价层级来应对需求上升。该危机预计将持续至2029年甚至更久。

人工智能行业因GPU价格上涨面临算力短缺

资讯正文

人工智能行业正面临计算资源短缺,出现停机、配额限制以及GPU价格飙升的问题。

关键要点:

- 对代理型AI的强劲需求正在引发大规模算力危机。据《华尔街日报》报道,Anthropic的API可用性仅为98.95%,远低于行业标准的99.99%,该公司已因此失去部分企业客户,转而投向OpenAI。

- OpenAI正在关闭其视频生成应用Sora,以释放算力用于编码和企业产品。从10月到3月,令牌使用量从每分钟60亿跃升至150亿。

- 根据Ornn算力价格指数,GPU价格上涨了48%。美国银行分析师预计,需求将至少持续超过供应到2029年。

代理型AI的迅猛增长正与有限的算力容量发生碰撞。Anthropic遭遇停机,OpenAI宣布终止Sora项目,市场数据显示GPU价格几乎上涨了50%。

人工智能热潮正在以超出行业供给速度的速度消耗算力。根据《华尔街日报》报道,代理型AI——即能自主完成任务的工具——的爆炸式增长在近几个月内引发了严重的容量危机。后果包括主要提供商频繁停机、产品被取消或缩减规模,以及芯片价格急剧上涨。

Anthropic增长迅速却难以维持稳定运行

Anthropic是Claude聊天机器人和Claude Code编程应用的制造商,受冲击尤为严重。据《华尔街日报》报道,自2月中旬以来,停机事件频繁发生,一些企业客户已转向其他服务商。软件平台Retool的创始人David Hsu告诉《华尔街日报》,他其实更青睐Anthropic的Opus 4.6模型,但最近转投OpenAI,因为Anthropic的服务频频中断。

报道称,截至4月8日的90天内,Claude API的正常运行时间为98.95%,远低于主流云服务提供商通常维持的99.99%标准。

与此同时,Anthropic的增长速度惊人。该公司年化收入率(ARR)在2025年底为90亿美元,2月增至140亿美元,两个月后便突破300亿美元。

OpenAI为腾出算力暂停Sora,专注编码和企业工具

OpenAI也感受到压力。公司最近宣布将关闭其Sora视频生成应用,部分原因是为了将算力重新分配给基于代号Spud的新AI模型开发的编码和企业产品。Sora的网页版和App版本将于4月26日下线,API则将在9月停止服务。

据《华尔街日报》报道,OpenAI API的令牌使用量从10月的每分钟60亿上升至3月底的每分钟150亿。OpenAI首席财务官萨拉·弗雷告诉《华尔街日报》,她大部分时间都在寻找短期算力资源,并且公司不得不做出艰难决定,搁置某些项目,因为资源根本无法满足需求。

自今年1月以来,各服务商已陆续推出新限制措施,以应对代理型AI带来的算力激增潮。

人工智能行业正面临算力短缺问题,导致服务中断、配额限制以及GPU价格飙升。

这一容量危机也在重塑开发者工具的规划,这些工具越来越多地运行需要消耗大量token的代理型工作负载。

GitHub于4月10日宣布对Copilot设定新的使用上限,明确指出快速扩张、高并发和高强度使用是主要原因。达到新上限的用户需等待或切换至其他模型。

OpenAI也在4月初将企业版Codex的计费方式从固定消息计价改为按token计量,并推出面向长时间、计算密集型编程场景的新“Pro”套餐(定价100美元),而原先的Plus计划则调整为更适合一周内多次短时会话的模式,而非单次高强度使用。

Windsurf在3月取消了原有的积分系统,改用每日和每周配额,并提供以API价格购买额外容量的服务。Anthropic则在3月底调整了会话限制,并在非高峰时段临时将可用额度翻倍,以更均匀地分配负载。

整体趋势十分明显:普通聊天与代理型任务正在被分别定价,而重负载任务则通过专用资源池、积分体系和基于token的附加费用进行管理。

随着基础设施无法跟上需求增长,GPU价格正在迅速上涨。

根据Ornn算力价格指数,Nvidia最新一代Blackwell芯片的现货市场价格已显著攀升,每小时价格达到4.08美元,相比两个月前的2.75美元上涨了48%。

《华尔街日报》报道称,全球最大的公开上市AI云服务商之一Coreweave在2025年底将价格上调超过20%,并要求小型客户签署三年合约而非一年期合约。美国银行分析师预计,到至少2029年,需求仍将超过供应。

Vultr首席执行官J.J. Kardwell向《华尔街日报》表示,当前的算力危机是他五年多来经营云基础设施业务以来从未见过的情况。他指出,硬件交货周期长、数据中心建设缓慢,以及到2026年可用电力早已被预订完毕,是主要瓶颈。

提价是一种缓解短缺的方式,但对于正处于激烈用户争夺战中的头部AI公司来说,这将是风险极高的举措。

来源与参考

  1. 原始链接
  2. The AI industry is running out of compute, with outages, rationing, and rising GPU prices

收录于 2026-04-14