谷歌用每月 9.2 亿美元锁定 SpaceX 算力
这笔多年期协议显示,顶级 AI 玩家仍在为稀缺 GPU 资源支付高价,短期租算力已成为应对需求激增的常态。(#2307)
AI 日报
今天的主线很清晰:AI 不再只是模型竞赛,而是算力、预算、法律与电力的全栈博弈。大厂一边争抢 GPU 和数据中心容量,一边又被成本、合规和安全问题拖住脚步,整个行业正在从“快速扩张”进入“必须证明自己”的阶段。
Overview
从 42 条资讯中筛选出 20 条
今天的主线很清晰:AI 不再只是模型竞赛,而是算力、预算、法律与电力的全栈博弈。大厂一边争抢 GPU 和数据中心容量,一边又被成本、合规和安全问题拖住脚步,整个行业正在从“快速扩张”进入“必须证明自己”的阶段。
这笔多年期协议显示,顶级 AI 玩家仍在为稀缺 GPU 资源支付高价,短期租算力已成为应对需求激增的常态。(#2307)
从 Tokenomics Foundation 到 Cloudflare 的预算与身份控制,企业终于把“AI 花多少钱”当成必须管理的核心问题。(#2308 #2316)
纽约暂停新大型数据中心、犹他州项目缩半,说明电力、水和土地正成为 AI 基础设施扩张的硬约束。(#2314 #2315)
佛州诉 OpenAI、Meta 代理接管账号、NSA 使用 Anthropic 模型的报道,都把 AI 风险带到了现实安全与法律责任层面。(#2306 #2305 #2312)
Anthropic 推进 IPO、微软反对成瘾式代理设计、Airbnb 计划自建 AI 实验室,反映出行业正在同时争夺资本、人才和产品控制权。(#2310 #2313 #2325 #2324)
AI 行业的扩张正在遇到现实边界:算力供给争夺持续升温,企业开始紧盯 token 账单,监管与安全风险也同步加压。(#2307 #2308 #2314 #2306)
谷歌与 SpaceX 签下每月 9.2 亿美元的算力协议,折射出顶级科技公司对 GPU 资源的激烈竞争;与此同时,AirTrunk 宣布将在印度投入 300 亿美元建设 5GW 数据中心容量,显示全球资本仍在继续向 AI 基础设施倾斜。(#2307 #2309)
企业端的 AI 使用成本正在失控。Linux Foundation 正推动 Tokenomics Foundation,Cloudflare 则直接把 AI Gateway 的预算控制和身份路由做成产品,说明 AI 支出管理正在从财务问题变成基础设施能力。(#2308 #2316)
纽约通过大型数据中心一年禁令,犹他州项目也因水、电与环境争议被砍半,表明 AI 基础设施的扩张已经进入更强的政策审视期。算力项目不再只是商业问题,也在成为地方治理和能源分配问题。(#2314 #2315)
佛州起诉 OpenAI 和 Sam Altman,把 ChatGPT 直接放进产品责任与公共妨害框架;与此同时,Anthropic 的 Mythos 被报道用于 NSA 进攻性网络行动,Meta 的 Instagram 账号接管事件则提醒人们:AI 代理的安全漏洞已经是现实问题,而不是未来想象。(#2306 #2312 #2305)
Anthropic 秘密推进 IPO,同时强调前沿模型需要公开市场资本;它还宣称 Claude 已经写出公司大部分代码,并呼吁全球可验证的 AI 暂停机制。微软则公开否决“上瘾式”代理设计,Airbnb CEO 也计划启动新的 AI 实验室,说明行业内部正在围绕产品方向、治理边界和组织控制权重新分化。(#2310 #2313 #2325 #2324 #2319)
今天的新闻共同指向一个结论:AI 的竞争优势正在从“谁先做出模型”转向“谁能稳定拿到算力、控制成本、通过监管、并把安全与产品责任说清楚”。换句话说,AI 行业已经从单点突破时代,进入系统工程时代。(#2307 #2308 #2306 #2314 #2316)
Stories
TechCrunch AI

SpaceX 在一份监管文件中披露,谷歌将从 2026 年 10 月到 2029 年 6 月每月支付 9.2 亿美元,以获得约 11 万个 NVIDIA GPU、CPU、内存及相关组件的使用权。该协议发布于 SpaceX 预计登陆 Nasdaq 之前。
这笔交易凸显了大型科技公司正在激烈争夺稀缺的 AI 算力资源,尤其是用于前沿模型和 AI 产品的 GPU 密集型基础设施。它也说明即使是拥有庞大算力储备的谷歌,也在购买短期过渡算力,以应对激增的需求。
SpaceX 在筹备历史性 IPO 之际,又签下了一份重大的算力合同,这次的合作对象是谷歌。公司在周五提交的监管文件中披露,谷歌将从 2026 年 10 月到 2029 年 6 月每月支付 9.2 亿美元,以获得约 11 万个 NVIDIA GPU、CPU、内存及其他相关组件的使用权。整体期限和规模与 SpaceX 5 月底和 Anthropic 达成的协议相近,不过谷歌获得的算力大约只有 Anthropic 在 Memphis 附近的 Colossus 1 数据中心可用算力的一半。SpaceX 并未说明谷歌会使用哪一个具体数据中心,但 Elon Musk 之前曾表示 Colossus 2 会保留给 xAI 使用。文件显示,谷歌的使用权限会在 9 月前逐步提升,期间费用较低,且双方在 2026 年 12 月 31 日之后都可以提前 90 天终止协议。
如果 SpaceX 未能在 2026 年 9 月 30 日前交付承诺数量的 GPU,谷歌可以在一个月宽限期后立即终止合同,或者接受较少的 GPU,并按比例降低月费。谷歌表示,这份协议是为了应对其 AI 产品需求意外强劲而采取的短期过渡方案,重点包括 agent 平台和 Gemini Enterprise。与此同时,Alphabet 正在大举投入基础设施,今年已承诺超过 1800 亿美元的资本支出,并表示 2027 年还会显著增加。该交易出现在 SpaceX 预计即将在 Nasdaq 开始交易的前一周,而这次 IPO 可能会成为历史上规模最大的 IPO;交易完成后,谷歌在 SpaceX 的持股价值预计将超过 1000 亿美元。
这份合同在期限和结构上与 SpaceX 近期和 Anthropic 的协议类似,谷歌的使用权限会在 9 月前逐步提升,且费用较低。文件还包含一项条款:在 2026 年 12 月 31 日之后双方可提前 90 天终止协议;如果 SpaceX 未能在 2026 年 9 月 30 日前交付承诺数量的 GPU,谷歌可直接解除协议,或接受更少的 GPU 并相应降低月费。
TechCrunch AI

TechCrunch 报道称,随着 token 使用量和 agentic 工作流把成本推得远超预期,各家公司正在迅速收紧 AI 预算。作为回应,Linux Foundation 宣布计划成立 Tokenomics Foundation,希望像 FinOps 管理云支出那样为 AI 花费建立标准与纪律。
AI 落地的讨论正在从“它能不能用”转向对可见性、可审计性和投资回报的严肃追问。尤其是大规模部署 AI 编程和 agent 工作流的公司,可能需要专门的成本控制机制,否则很容易在看不清业务价值的情况下超支。
TechCrunch 表示,AI 成本问题已经从理论争论变成了各家公司日常预算中的现实压力。2025 年初大量企业冲进高配 AI 订阅方案,如今却发现实际使用量远超预期,尤其是 autonomous 和 agentic 工具会消耗比普通聊天更多的 token。文中提到,Uber 据称在 4 月就花光了整个 2026 年的 AI 编程预算,Microsoft 在最初开放 Claude Code 后又撤回了相关许可,而 Priceline 员工则表示一次常规的 Cursor 续约报价竟然贵了 4 到 5 倍。文章指出,虽然单个 token 的价格下降了,但由于公司更激进地使用 AI、并让模型承担更多工作,总账单仍在持续上升。
OpenAI 企业负责人 Alexander Embiricos 表示,客户现在不再主要问模型“好不好用”,而是更关心支出可见性、可审计性、token 控制以及模型效率。作为回应,Linux Foundation 正在成立 Tokenomics Foundation,希望像 FinOps 之于云基础设施那样,为 AI 支出建立标准化和成本纪律。FinOps Foundation 负责人 J.R. Storment 说,很多公司到春天就已经超出全年 token 预算数倍,大家的讨论也从“快点用起来”转向“我们有哪些护栏”。文章最后强调,市场正在加速推出工具和标准,因为企业需要在费用继续失控之前,先把 AI 使用量测出来、管起来,并证明它到底值不值。
文中举例称,Uber 在 4 月就用光了 2026 年 AI 编程预算,Microsoft 撤销了 Claude Code 许可证,而 Priceline 员工则表示 Cursor 续约报价上涨了 4 到 5 倍。文章还引用 Faros AI 和 Jellyfish 的研究,指出最“烧 token”的工程师可能更高产,但 token 消耗也高得多,而且最终业务回报并不清晰。
TechCrunch AI

AirTrunk表示,将在2030年前向印度投资300亿美元,建设5吉瓦新的数据中心容量。 这家由Blackstone支持的数据中心运营商在今年早些时候通过收购Lumina CloudInfra进入印度市场后,正进一步扩大在印度的布局。
这是一项在印度宣布的最大规模AI基础设施投资之一,说明印度正在成为全球算力扩张的重要目的地。它可能加速云和AI容量建设,惠及超大规模云厂商、企业和本地科技公司,同时也会加剧对电力、土地等稀缺资源的竞争。
Blackstone支持的AirTrunk在周五表示,计划到2030年在印度投资300亿美元。 这家澳大利亚数据中心运营商称,这笔资金将用于建设5吉瓦新的数据中心容量,使其成为印度数字基础设施领域最大规模的承诺之一。 AirTrunk今年早些时候才进入印度,当时它收购了Lumina CloudInfra。 这一动作发生在科技公司和基础设施投资者寻找新市场、扩展AI与云计算容量的背景下。 研究机构Bernstein预计,到2030年印度的数据中心容量可能从目前约1.5GW增长到多达8GW。 印度政府也在积极吸引这类投资,曾为外国云服务商提供税收豁免:如果海外售出的服务负载运行在印度数据中心内,可享受延续到2047年的税收优惠。
本周,马哈拉施特拉邦首席部长Devendra Fadnavis表示,该邦已就拉伊加德Pen Growth Center的土地划拨交换意向书,而AirTrunk计划在那里建设一个3GW项目,投资约2万亿卢比,约合210亿美元。 AirTrunk还表示,其在孟买、金奈和海得拉巴已有约600MW的开发管线,但并未说明拉伊加德项目是否会覆盖5GW目标中的大部分,也未说明是否还会在印度其他地区继续开发。 该公告发布前,AirTrunk首席执行官Robin Khuda刚与印度总理纳伦德拉·莫迪会面,莫迪在X上表示,这项投资将帮助印度强化其作为全球云计算和人工智能中心的地位。 AirTrunk加入了在印度投资基础设施的公司行列,其中包括Amazon、Google、Microsoft、OpenAI和Uber,以及印度本土的Reliance Industries、Adani Group和TCS。 但数据中心需要大量电力、水和土地,业内高管和分析师都指出资源约束可能成为瓶颈,尤其是电力供应。 Deloitte估计,到本 दशक末,亚太地区的数据中心扩建可能需要新增数十太瓦时的电力。
AirTrunk表示,其在印度的扩张受到政府支持、技术人才储备以及可再生能源获取能力的支撑。该公司目前在孟买、金奈和海得拉巴已有约600MW的开发管线,但尚未说明拉伊加德项目是否会承担5GW目标中的大部分容量。
TechCrunch AI

Anthropic已秘密提交IPO申请,这意味着公司在完成一轮巨额私人融资后,正准备登陆公开市场。联合创始人Daniela Amodei表示,这一决定反映出训练前沿模型和进行推理所需的前期资本极其庞大。
这次申报凸显出,头部AI实验室越来越依赖充足资本来支持模型研发、基础设施和业务扩张。如果Anthropic最终上市,它可能会成为市场衡量生成式AI高速营收增长价值的重要标杆。
在私人投资者对Anthropic需求空前强烈之际,这家公司正转向公开市场。Anthropic最近宣布完成一轮650亿美元融资,对应估值达到9650亿美元,多位投资者告诉TechCrunch,这轮融资的认购需求严重超额。尽管私募市场热度很高,Anthropic现在还是秘密提交了IPO申请。联合创始人Daniela Amodei在Bloomberg Tech大会上表示,原因在于资本:训练前沿模型并为其提供推理服务,需要巨额前期投入。她认为,推动AI前沿发展的公司,最终都需要接入公开市场,因为那里更能提供与需求规模相匹配的资本。Anthropic的增长速度极快,5月的年化营收已经超过47亿美元,而2025年底时大约只有9亿美元。
不过,这种增长也面临现实考验,因为Uber等公司曾表示,AI虽然能带来回报,但并非所有AI支出都已证明有效,这可能导致企业收紧预算,从而放缓整个行业的增长。Amodei对此并不担忧,她认为企业仍处在学习如何有效部署AI的早期阶段。她提到,目前最重要的应用场景包括编码、金融服务、法律和医疗保健,随着商业界越来越熟悉这些工具,AI会逐步融入日常工作流程,并释放更多价值。她还解释说,Anthropic没有像OpenAI和Elon Musk的xAI那样自建数据中心,而是倾向于避免购买过多自己未必能高效使用的算力。就在上个月,Anthropic还因与xAI合作获取算力而引发行业关注,而SpaceX的S-1文件后来披露,这笔交易的成本高达每月12.5亿美元。
Anthropic表示,其年化营收在5月超过47亿美元,较2025年底约9亿美元大幅增长。Amodei还说,Anthropic不愿过度建设自有数据中心,而是希望避免购买超出自身有效消耗能力的算力。
The Decoder

佛罗里达州提交了一份83页的诉讼,起诉 OpenAI 及其首席执行官 Sam Altman,指控 ChatGPT 是危险的缺陷产品并构成公共妨害。这是美国首个直接起诉 Altman 本人的州政府诉讼,州方称该聊天机器人伤害了未成年人和其他用户。
此案可能影响法院如何依据产品责任和公共妨害理论看待 AI 聊天机器人,从而为监管聊天机器人提供一种新的法律路径。如果佛罗里达州胜诉,可能会影响后续诉讼,并迫使 AI 公司加强安全、年龄验证和风险控制。
佛罗里达州对 OpenAI 及首席执行官 Sam Altman 提起了一起具有里程碑意义的诉讼,主张应将 ChatGPT 视为缺陷产品和公共妨害。该83页诉状称,OpenAI 一边把聊天机器人包装成安全产品,一边让它输出危险内容、诱导依赖,并造成暴力和其他伤害。州总检察长 James Uthmeier 表示,OpenAI “让儿童处于极大风险之中”,并警告州方可能寻求数十亿美元级别的罚款。该案之所以引人关注,是因为它是美国首个直接把 Sam Altman 个人列为被告的州级诉讼。诉状还采用了不寻常的法律思路,把聊天机器人当作可以追究产品责任的“产品”,而不仅仅是软件或言论问题。
根据诉状,ChatGPT 的免费版本缺乏真正的年龄验证,但州方称有大量未满13岁的用户在使用。佛罗里达州还指控 OpenAI 在用户同意服务条款之前就开始收集数据。诉状进一步声称,AI 使用可能导致认知能力退化,并援引内部指控称 OpenAI 过早缩短了 GPT-4o 的安全测试,而且用于 AI 安全的算力只占 1% 到 2%,远低于承诺的 20%。截至目前,OpenAI 尚未对这起诉讼发表评论。
诉状称,ChatGPT 的免费版本没有真正的年龄验证,尽管州方指称有数万名用户未满13岁。诉状还指控 OpenAI 在用户同意服务条款之前就开始收集数据,并声称内部安全决策存在问题,包括据称缩短了 GPT-4o 的安全测试,以及投入安全工作的算力比例低于承诺。
The Decoder

《金融时报》报道称,美国国家安全局正在使用 Anthropic 的 Mythos 模型开展进攻性网络行动,其中可能包括针对中国和伊朗网络的行动。报道称,Anthropic 还向 NSA 派驻了大约六名工程师,以便对模型进行适配并支持其部署。
如果属实,这意味着前沿 AI 模型已被直接整合进真实的政府网络行动,而不仅仅是用于防御工具或实验室测试。此事引发了关于 AI 治理、商用模型军事用途,以及强调安全的公司如何应对国家对进攻能力需求的重大问题。
《金融时报》报道称,美国国家安全局正在将 Anthropic 的 Mythos AI 模型用于进攻性网络行动。报道提到,该模型可能被用来协助入侵中国或伊朗等国家的网络。根据报道,Anthropic 已经向 NSA 派驻了大约六名工程师,用于适配该系统并支持其使用。文章同时指出,目前尚不清楚这些工程师是否直接参与了真实行动。报道把这一部署放在 Anthropic 与美国国防部持续争议的背景下来看。
五角大楼此前将 Anthropic 视为供应链风险,并试图将其排除在合同之外,因为 Anthropic 希望限制 Claude 被用于大规模监控和自主无人机等用途。与此不同,NSA 相关部署据称被排除在这些限制之外。文章认为,Anthropic 似乎并不把 NSA 的使用视为与自身价值冲突,因为其在与五角大楼沟通时始终强调的是保护美国公民免受 AI 威胁。文章还提到,Anthropic 最近把 Mythos 的访问权限扩展到了 15 个国家的 150 个组织,而特朗普总统签署了关于新 AI 模型自愿安全测试的行政命令,Anthropic 对此持积极态度。
报道称,Anthropic 的工程师正在 NSA 协助适配 Mythos,但尚不清楚他们是否参与了实际行动。报道还指出,Anthropic 与五角大楼围绕限制大规模监控和自主无人机等用途存在冲突,但 NSA 方面的部署被排除在该限制之外。
The Decoder

Anthropic表示,Claude现在生成了公司生产代码中超过80%的内容,而高层估计如果把脚本和实验性代码也算上,这一比例超过90%。与此同时,该公司还主张建立一种可验证的全球性前沿AI开发暂停机制,以降低安全风险。
这展示了AI正在大规模参与AI系统自身的开发,可能重塑软件工程效率以及前沿模型的研发方式。Anthropic呼吁建立可验证的全球暂停机制,也使其站到了AI治理争论的中心,因为单个实验室单方面停手可能并不足够。
Anthropic通过其内部的 Anthropic Institute 发布了一份报告,并使用了此前未公开的内部数据,来展示Claude在公司自身开发中的参与程度。报告最引人注目的结论是,Claude现在撰写了Anthropic生产代码中超过80%的内容,而高层估计如果把脚本和实验性代码也算上,这一比例超过90%。公司称,这与2025年2月Claude Code发布前相比是巨大变化,当时这一比例还只有很低的个位数。文中引用的一名员工甚至表示,自己大约已经有五个月没有亲自写过任何代码了。Anthropic还表示,2026年第二季度工程师每天交付的代码量大约是2024年的8倍,但公司同时承认,代码行数并不能很好衡量真实生产力,而且这一数字很可能高估了实际提升。
2026年3月的一项内部调查覆盖130名员工,结果显示中位数估计认为 Mythos Preview 带来的生产力提升约为4倍,而Anthropic认为这个数字仍然略高。关于质量,报告称Claude写出的代码在2025年末还比人工代码略差,如今已经大致持平,并预计一年内会变得明显更好。Anthropic还举例说,一个自动化的Claude审查器本可以在某些claude.ai事故进入生产环境之前发现其中约三分之一的bug;另一个例子是,2026年4月Claude完成了800多项修复,将某类API错误减少了1000倍。除了写代码之外,Anthropic还表示Claude在研究类任务上也在进步,并在某些领域接近人类水平的判断能力。公司称,AI系统能够独立可靠处理任务的时长大约每四个月就会翻倍,因此完全自主的递归自我改进可能比许多机构预期来得更快,这也是它呼吁建立可验证、全球性的前沿AI开发暂停机制的原因。
Anthropic表示,2026年第二季度工程师每天交付的代码量大约是2024年的8倍,但公司也提醒,代码行数并不能准确代表真实生产力。该公司称,Claude写出的代码在2025年末还不如人工代码,现在已大致持平,并可能在一年内变得更好。
The Verge AI

纽约州立法机构通过了一项为期一年的新建大型数据中心暂停令,如果州长 Kathy Hochul 签署,这将成为美国首个此类全州禁令。该法案针对峰值需求至少 20 兆瓦的项目,并要求在继续审批前提交环境影响报告。
这一举措可能会放缓数据中心扩张,而人工智能基础设施和云服务需求正在推高用电量。它也为各州如何在批准大型数字基础设施项目之前权衡电网可靠性、用水、土地占用和污染问题树立了一个重要先例。
纽约州立法机构已经通过了一项为期一年的新建大型数据中心暂停令,这项措施如果由民主党州长 Kathy Hochul 签署,将成为美国首个同类全州禁令。支持者表示,这一暂停是为了给政策制定者争取时间,更全面了解大型数据中心对环境和电价的影响。法案要求州环境机构出具一份影响报告,评估这些设施的用电、用水、土地占用以及污染情况。它还要求任何计划建设的大型数据中心先举行一次公开听证会,并由企业承担费用,且听证会必须至少在项目获批前三个月举行。法案中“大型数据中心”的定义是峰值需求至少 20 兆瓦。Hochul 目前还没有说明是否会签署该法案,并且据 Bloomberg Government 报道,她必须在 12 月前决定。
数据中心问题之所以具有高度争议,是因为调查显示,大多数美国人并不欢迎数据中心落户自己社区,而且全国各地的公开会议都表明这一议题能同时激起两党关注。纽约并不是唯一尝试限制数据中心扩张的州;今年早些时候,缅因州曾通过一项更广泛的禁令,计划持续到 2027 年末,但州长 Janet Mills 因法案未为此前规划中的一个项目设置豁免而予以否决。与此同时,纽约独立系统运营机构正在审查 24 个数据中心提案,总装机需求超过 9,000 兆瓦,阿尔巴尼一个 180 兆瓦项目也已经引发居民担忧。行业团体则认为,全面暂停会损害经济发展,因为这会让州政府无法逐案判断哪些项目实际上可能对经济有帮助。与最初提出的三年版本相比,这次通过的一年期限更短,但仍然意味着州政府对数据中心建设进行了强力干预。
该法案要求州环境机构评估数据中心的用电、用水、土地占用和污染影响,同时规定企业在项目获批前三个月至少要举行并资助一次公开听证会。Hochul 尚未表态是否签署,并将在 12 月前作出决定。
Ars Technica AI

一个名为 Stratos 的犹他州超大规模数据中心项目在开工前被砍掉一半,因为当地爆发了强烈反对。开发者凯文·奥利里表示,项目规模已从约 40,000 英亩缩减到约 20,000 英亩。
这一事件表明,即便是最大的 AI 和云基础设施项目,也可能因地方阻力而被迫重塑,尤其是在涉及水资源和电力消耗时。它也凸显出,数据中心在争夺稀缺资源时正面临越来越强的政治和社区审视。
犹他州一个原本计划极其庞大的数据中心开发项目,在经历数月地方反弹后被大幅缩减。这个名为 Stratos 的项目最初设想为分布在多个地点的超大规模园区,最终规模接近曼哈顿面积的近三倍。由于项目尚未开工,Box Elder 县居民就已经围绕水资源、电力和环境问题组织起来反对它。争议的一个核心焦点,是计划将牧场的 1,900 英亩英尺水量转给数据中心项目,许多当地居民认为这会威胁本地供水,尤其是脆弱的大盐湖。为了反对这项水权转移,一些居民甚至支付 15 美元提交意见。
批评者还担心项目会推高电费,并对空气质量、野生动物和土地造成影响。支持该项目的风险投资人、O’Leary Digital 主席兼《Shark Tank》投资人凯文·奥利里后来表示,他后悔没有更早与政府和公众保持透明沟通,也没有在项目初期就更多听取民意。他承认自己和州政府原本错误地以为公众会欢迎这笔大型本地投资,并坦言“犯了大错”。随后,犹他州参议院院长、共和党人斯图尔特·亚当斯致信奥利里,要求将项目规模缩减 75%。在华盛顿特区的一场 AI 活动上,奥利里表示自己“别无选择”只能同意,于是项目从约 40,000 英亩缩减到约 20,000 英亩,其中 10,000 英亩将保持未开发,实际可开发的数据中心用地只剩初始规模的大约四分之一。
居民反对将 1,900 英亩英尺的水从一个牧场转给该项目,并担心电费上涨、空气质量、野生动物和土地影响。犹他州参议院院长斯图尔特·亚当斯要求奥利里将项目缩减 75%,奥利里则表示自己“别无选择”只能缩小规模。
Cloudflare AI

Cloudflare 宣布为 AI Gateway 增加支出控制,并通过 Cloudflare Access 和现有身份提供商开启基于身份的预算与路由闭测。该功能让团队可以直接设置美元额度,而不只是等账单出来后再查看用量。
AI 使用成本正在成为一个重要的 FinOps 问题,尤其是在多人共用同一个 API key 时,财务团队很难把支出归因到个人、团队或应用。这个控制能力有助于企业避免账单惊喜、落实预算,并把不同用户或工作负载路由到合适的模型,而不是默认使用最贵的模型。
Cloudflare 表示,许多公司在推动员工积极使用 AI 的同时,没有建立足够清晰的控制措施,因此 AI 成本正在失控。它看到的典型场景是,团队共用一个 API key,使用量迅速增长,最后财务拿到账单时却没人能解释钱花到了哪里。为了解决这个问题,Cloudflare 同时推出了两项相关能力:AI Gateway 的支出控制,以及基于 Cloudflare Access 和现有身份提供商的身份驱动预算与路由闭测。AI Gateway 本身充当应用与 AI 提供商之间的中间层,因此发往 OpenAI、Anthropic、Google 等服务的请求都可以在一个地方被观察和控制。
它已经提供统一计费、请求日志、缓存、限流、内容护栏,以及在模型处理前拦截 PII 和密钥的能力。过去的问题在于,AI Gateway 只能看到整体使用情况,却难以回答是谁在花钱,也难以真正限制 AI 支出。新的 spend limits 功能把预算直接做成美元额度,可以实时跟踪累计成本,并按模型、提供商、用户、团队或应用等维度进行范围控制。Cloudflare 还支持按天、按周或按月的固定周期,以及滚动周期,帮助运维和财务团队把 AI 使用纳入明确的预算政策。
AI Gateway 本来就位于应用与 OpenAI、Anthropic、Google 等提供商之间,提供统一计费、请求日志、缓存、限流、内容护栏,以及在数据到达模型前拦截 PII 和密钥的能力。新的支出上限是按美元计算的真实预算,可按模型、提供商或用户、团队、应用等自定义属性设置,并支持按日、周、月的固定或滚动周期。
MIT Technology Review AI

6月5日的报道指出,攻击者只需让Meta的AI客服代理把Instagram账号绑定到他们控制的邮箱,就能接管账号。Meta随后表示,这一漏洞已经被修复。
这一事件表明,AI安全风险并不只存在于未来式的“模型被黑”场景中;防护不足的AI代理今天就可能被最基础的滥用方式利用。它之所以重要,是因为越来越多公司正在用代理处理账号找回等会直接影响用户和资产的操作。
6月5日,404 Media 报道称,攻击者一直在利用 Meta 的 AI 客服代理盗取 Instagram 账号。手法非常简单:他们要求代理把账号绑定到他们自己控制的邮箱,系统竟然直接同意了。报道称,其中一名攻击者闯入了闲置的奥巴马白宫账号,并发布了亲伊朗内容;其他人则盯上了有价值的单字母或单词账号,可能意在转卖。文章把这起事件与围绕 Anthropic 的 Mythos 模型的更广泛 AI 安全讨论作了对比,因为 Mythos 曾因被认为极擅长黑客攻击而引发关注。
但在这起案例中,AI 不是攻击者,而是被攻击的对象,而且利用方式远没有 Mythos 那么复杂。文中引用的学者表示,随着公司把更多工作流交给 AI 代理,攻击者会越来越有动力直接针对 AI 系统本身。Duke 大学教授 Neil Gong 认为,这种趋势尤其会出现在账号恢复等敏感场景中。文章还提到,研究人员早已警告过 AI 代理的漏洞,例如间接提示注入,而 Meta 方面已表示该问题现已修复。
据报道,这种利用方式要求攻击者使用与真实账号持有人位置相匹配的VPN,然后直接要求修改邮箱地址,代理就会照做。专家认为,这类问题本应在部署前被发现,并指出AI代理需要传统式防护措施和严格的红队测试。
Simon Willison
Simon Willison 转述并强调了 Charity Majors 的观点:AI 乐观派和 AI 怀疑派其实都在面对同一种压力,只是应对方式不同。文章把当前局面描述为一场竞赛——一方争分夺秒获取 AI 能力提升,另一方则试图避免技术债务和组织性衰败不断累积。
这篇文章准确抓住了许多工程团队正在面对的矛盾:快速引入 AI 可能带来竞争优势,但过快推进也可能损害可靠性、共同理解和值班体验。它因此不仅是关于 AI 采用的观念争论,更是一个实际的领导力和工程管理问题。
2026 年 6 月 4 日,Simon Willison 发布了一篇链接文章,转述并突出 Charity Majors 对当前 AI 软件争论的看法。Majors 认为,AI 乐观派并没有错,因为对于那些积极采用 AI 的团队来说,确实已经出现了真实的、非渐进式的能力跃升。她指出,这种变化不像普通技术周期那样可以慢慢观察和等待,因为如果竞争对手推进得更快,选择观望的团队可能会在尘埃落定之前就失去生存空间。与此同时,她也认为 AI 怀疑派同样没有错,因为当代码交付速度快到工程师来不及阅读和理解时,可靠性和组织知识都会被持续侵蚀。
按照她的说法,这最终会导致系统变得无人真正理解,产品逐渐走向混乱,值班制度也会把人消耗殆尽。Willison 在文章中用重复强调了这一对立双方都“并没有错”的核心观点。她/他认为,这个问题既是领导力问题,也是工程问题。最关键的组织挑战在于,AI 乐观派和怀疑派之间并没有天然的反馈回路,因此团队必须有意识地设计机制,去弥合双方对现实的认知差距。
Majors 认为,当团队交付代码的速度快到工程师来不及读懂时,尤其是在没有人拥有完整上下文的情况下,就等于在消耗一个长期积累起来的“信任账户”。Willison 强调,AI 乐观派和怀疑派之间没有天然的反馈回路,因此组织需要专门设计机制来弥合双方对现实的认知差距。
Ars Technica AI

标普道琼斯指数公司在6月4日表示,不会修改资格规则来让SpaceX快速纳入标普500。这个决定也意味着,OpenAI和Anthropic等尚未盈利的AI公司将无法借此走捷径在IPO后迅速进入该指数。
纳入标普500会触发被动指数基金的大规模机械买入,因此这一决定直接影响SpaceX及类似公司上市后能吸引多少资金。它也表明,主要指数提供商仍在抵制为规模很大但尚未盈利的科技公司放松标准的压力。
据报道,SpaceX 在计划进入公开市场时,曾要求多个主要股票指数为其提供异常快速的纳入通道。最重要的目标是标普500,因为一旦纳入该指数,就会触发跟踪该基准的被动基金进行大量机械买入。标普道琼斯指数公司在6月4日拒绝了为SpaceX修改规则的想法。该公司表示,将维持现有资格标准不变,包括财务可行性筛查、新股上市的观察期,以及最低可投资权重系数要求。这意味着,尽管SpaceX预期市值巨大,它仍无法获得进入该指数的特殊路径。这个决定不仅影响SpaceX本身,也因为它消除了未来尚未盈利的AI公司如OpenAI和Anthropic可能借鉴的先例。
文章指出,如果标普同意放宽规则,这些公司也可能受益于同样的待遇。彭博行业研究估计,纳入标普500可能会为SpaceX带来约140亿美元的被动买入,为OpenAI带来超过80亿美元,为Anthropic带来约46亿美元。报道还提到,大约7.5万亿美元的被动管理基金跟踪标普500,因此是否纳入该指数对公司流动性影响巨大。标普虽然对一些较低知名度的基准指数做了有限让步,但并未对旗舰级的标普500放松标准。文章还指出,其他指数提供商的态度更灵活:Nasdaq 已修改规则,让SpaceX可以更快进入 Nasdaq-100,FTSE Russell 也为SpaceX和其他一些公司加快了纳入节奏。
标普道琼斯指数公司拒绝为所谓市值“前所未有”的MegaCap公司豁免12个月观察期、最低可投资权重系数要求以及盈利筛选条件。彭博行业研究估计,若进入标普500,SpaceX可能获得约140亿美元资金,OpenAI超过80亿美元,Anthropic约46亿美元。
Ars Technica AI

Ars Technica 发布了一篇持怀疑态度的指南,指出病毒式传播的人形机器人演示往往夸大了这些机器人的实际能力。文章强调,跳舞、后空翻或做家务的炫酷视频,并不能证明它们在真实世界里具备可靠表现。
人形机器人正在吸引大量投资,而在技术真正成熟之前,公众认知很容易被精心设计的演示所塑造。文章指出,炒作会模糊精彩表演和真正具备规模化实用价值的产品之间的界限。
这篇文章认为,人形机器人正处在一个“热度高于现实”的阶段,精心制作的视频很容易让人误以为它们已经接近通用、可大规模使用的机器。实际上,演示成功和证明同一台机器人能在真实环境中反复稳定完成任务之间,仍然存在很大差距。Agility Robotics 联合创始人、也是 Oregon State University 的研究者 Jonathan Hurst 指出,人形外观本身就会让人们过度推断机器人具备更多能力。他提醒说,初创公司可能会利用这种心理来融资。
University of California, Berkeley 的 Sergey Levine 以及 Physical Intelligence 的联合创始人强调,真正困难的问题是“泛化能力”:机器人不仅要会在一个精心布置的场景里倒酒,还要能面对不同的瓶子、杯子和环境。Levine 表示,在舞台上完成后空翻,远比在各种现实条件下稳定倒酒容易得多。他认为衡量机器人真实能力的标准应当是定量、规模化、面向真实环境的评估,因为单个演示无法反映能力边界。
文章还给出了观看机器人视频时需要注意的几个要点。Purdue University 计算机科学博士生、美国陆军 DevCom Army Research Lab 研究助理 Dipam Patel 说,除非研究论文或公司明确说明,否则很多演示都可能依赖遥操作,而不是完全自主。观众还要区分机器人是在全新的测试环境中首次执行任务,还是只是在重复已经学会的动作,因为前者更能说明其具备更强的通用能力。
Patel 还建议查看视频是否调整了播放速度,因为出于安全等原因,机器人通常会被放慢演示。有些公司会明确标注视频以两倍或四倍速度播放,这会让机器人看起来比实际效率高得多。文章最后指出,机器人演示视频的透明度差异很大,有些是为了社交媒体传播的表演内容,有些是面向客户和投资者的宣传片,也有些会展示训练过程并承认错误。即便如此,看到一段精彩且“真实感”很强的视频时,观众仍应谨慎,不要把它直接等同于可靠产品。
Jonathan Hurst 指出,人们往往会根据人形机器人的外观过度推断,认为它能像人类一样完成所有任务。Sergey Levine 强调,真正的能力需要在多样环境中进行定量的大规模测试;Dipam Patel 则提醒,许多演示可能仍依赖遥操作、慢速播放,或在重复训练场景中完成,而不是真正的自主运行。
Simon Willison
Andreas Kling explains that Ladybird will stop accepting public pull requests because the project wants maintainers—not outside contributors—to own and be accountable for changes as it matures into a real-user browser.
This is a thoughtful but fairly narrow policy statement about contribution governance for the Ladybird browser project. It has moderate technical/community relevance, but it is more of an editorial quote than a major announcement; no discussion/comments were provided to indicate broader engagement quality.
5th June 2026 We will no longer accept public pull requests. [...] A substantial patch used to imply substantial effort, and that effort was a reasonable proxy for good faith. That assumption no longer holds. [...] Whether code was typed by hand is beside the point. What matters is who is responsible for it once it enters the browser. Ladybird is becoming a browser for real users. The people introducing changes to it must be the people who decide those changes belong in the project, and who will answer for the consequences. We will no longer accept public pull requests. [...]…
TechCrunch AI

TechCrunch 的 Equity 播客提到了正在兴起的“在一起科技”趋势:像 Brynn Putnam 的 Board 这样的初创公司正在融资,主打线下游戏、社交体验和更有人情味的连接。节目还把这一趋势放在更大的 AI、IPO 和风险投资新闻背景下讨论,包括 Anthropic 的保密 IPO 申报以及 Alphabet 的 800 亿美元 AI 融资。
这期节目表明,一些创业者正在顺着 AI 浪潮的反方向下注,转而押注能把人们带回线下相聚的产品,这可能预示着消费科技领域出现有意义的反向趋势。它也反映出资本仍在大量流向 AI 和大型头部公司,而气候、国防以及创作者驱动媒体等更小的项目则在争夺关注和融资。
TechCrunch 的 Equity 播客借本周的新闻,讨论了它所称的“在一起科技”浪潮,也就是一批试图创造线下连接,而不是替代线下连接的初创公司。节目提到 Mirror 创始人 Brynn Putnam 为 Board 融资,这家公司主打线下游戏和社交体验,作为这一趋势的代表案例。节目还提到 cyberdeck 创作者正在制作一些充满奇思妙想的 DIY 电脑,这些产品甚至会鼓励用户“去摸草”,凸显出人们对更有触感、更有人情味产品的偏好。主持人认为,这并不只是简单的“反 AI”反弹,而更像是一些创始人和用户确实在转向强调身体在场和社交互动的产品。
除了消费端趋势,节目还讨论了 Anthropic 的保密 IPO 申报,并把它放在 Alphabet 800 亿美元 AI 融资的大背景下,思考资本是否仍然会继续回流到最大的 AI 玩家身上。节目也提到前 Meta CTO Mike Schroepfer 在几乎没人出手的情况下,为气候科技筹集了 2.5 亿美元,以及火箭发动机初创公司 Impulse 融资 5 亿美元,并强调这笔钱将用于雇人而不是 AI。最后,主持人还讨论了 Anthropic 的 S-1 可能在公开后带来什么信息,以及两位 YouTube 导演打入票房市场对创作者经济实力意味着什么。
这期播客把“在一起科技”描述为不只是单纯的反 AI 反弹,而是真实地转向更有人情味的产品。节目还提到 Anthropic 已经进行了保密方式的上市申报,这是一种允许公司先向监管机构私下提交材料、再逐步公开披露的 IPO 流程。
TechCrunch AI

Mira Murati在旧金山接受了Bloomberg采访,这是她大约18个月来的首次重要媒体露面。她介绍了Thinking Machines Lab正在探索的“交互模型”,并强调Tinker——一个用于微调开源AI模型的API——是公司目前唯一已发布的产品。
Murati是OpenAI最知名的前高管之一,她重新露面说明Thinking Machines在低调运作一年半后开始尝试提高存在感。这个故事也反映了AI行业的一个更大趋势:人才、客户和资本注意力正越来越集中在少数头部实验室,新进入者很难长期保持“隐身”。
这篇报道讲的是 Mira Murati 在创办 Thinking Machines Lab 之后,如何谨慎地重新回到公众视野。她在旧金山接受 Bloomberg 采访,这是她大约 18 个月以来首次重要媒体亮相,但整场谈话依然非常克制,没有放出激进承诺。过去一年半里,Thinking Machines 一直在低调推进:融资、招募研究人员,并且只发布了一个产品 Tinker。Tinker 是一个用于微调开源 AI 模型的 API,也是公司目前唯一真正对外推出的产品。报道指出,Thinking Machines 所处的 AI 市场竞争异常激烈,OpenAI、Anthropic 和 xAI 都在持续抢占人才、客户和媒体关注。Murati 选择在这个时间点露面,更多像是在提醒市场“我们还在”,而不是宣布一次重大产品发布。她在采访中预告了公司正在开发的“交互模型”,称其将以 200 毫秒为间隔持续处理音频、文本和视频流,更接近真实的人类交流方式。
她强调这只是一个早期方向,还不是最终成品,也没有给出明确发布时间。采访还回顾了 2023 年 11 月 OpenAI 董事会解雇 Sam Altman 的那段混乱时期,当时 Murati 曾短暂担任临时 CEO。她表示自己当时每一步都很清楚,因为核心出发点是保护使命和团队,但事后看来,她希望自己当时能推动更多信息透明和真正的交接安排。她没有直接回答自己是否仍信任 Altman,而是把话题转向更大的行业问题:AI 领域的关键决定过于集中在少数人手中,缺少足够的治理和制度制衡。对于 Thinking Machines 近期几名高调研究员离职的问题,Murati 轻描淡写地带过,认为前沿 AI 实验室的组织波动会被压缩到很短的时间里。她也承认,这个行业的薪酬已经高到惊人程度,这进一步放大了人员流动。
Murati将Thinking Machines的“交互模型”描述为以200毫秒间隔持续处理音频、文本和视频流的系统,而不是传统的提示—回复模式。她同时强调这项工作仍处于早期阶段,没有公布发布时间,并承认公司近期出现了研究人员离职,而前沿AI领域的薪酬已经高得异常。
TechCrunch AI

据彭博社和一位知情人士透露,Airbnb 首席执行官 Brian Chesky 计划支持一家新的 AI 实验室。此举发生在他对主流前沿实验室推出的模型越来越不满意之际。
这一决定表明,越来越多大型非 AI 科技公司的领导者不再只是前沿模型提供商的客户,而是希望直接参与塑造下一代 AI。它也反映出硅谷普遍存在的挫败感,即现有模型可能 هنوز无法满足产品、设计和交互方面的需求。
据报道,Airbnb 首席执行官 Brian Chesky 正准备启动自己的 AI 实验室,这意味着他将从前沿 AI 生态中的顾问和潜在合作伙伴,转向更直接的竞争者。该消息最初由彭博社披露,随后又由一位知情人士向 TechCrunch 证实。报道将 Chesky 描述为硅谷一批对当前前沿实验室产出不满的领导者之一。Airbnb 已经采用了 AI 编码工具,但 Chesky 去年表示,公司尚未达成 LLM 合作,因为当时可用的产品还不够成熟。Chesky 与 OpenAI CEO Sam Altman 的关系由来已久,早在他们在 Y Combinator 时期就已相识,后来他还在 OpenAI 的领导危机中为 Altman 提供建议。
报道还称,他曾被视为 OpenAI 董事会的潜在人选,并在董事会解雇 Altman 后帮助争取支持,推动 Altman 回归。新实验室的具体任务尚未公布,但彭博社称其重点可能会放在用户交互和设计上。这种方向与 Brett Adcock 今年晚些时候推出的 Hark 有些相似,后者也是一家专注于 AI 助手新交互界面的实验室,不过 Hark 还强调硬件产品。目前看来,Chesky 不会离开 Airbnb,也不会亲自日常领导这个实验室,而 Airbnb 和 Chesky 都拒绝就此置评。
Chesky 过去已经在 Airbnb 使用 AI 编码工具,但他去年表示,公司之所以没有达成 LLM 合作,是因为现有产品还不够成熟。新实验室的具体方向仍不明确,但彭博社称可能聚焦用户交互和设计;Chesky 将继续担任 Airbnb CEO,并不会亲自领导这个实验室。
The Decoder

微软首席执行官萨提亚·纳德拉公开批评了一份内部备忘录,该备忘录据称建议把公司的新AI代理Scout设计得“让人上瘾”。他表示这“绝对不是目标”,并强调AI应该赋能用户、创造真实价值。
这一表态凸显了AI产品设计中的一个重要矛盾:助手究竟是要最大化使用时长,还是要更高效地帮助用户完成任务。它也表明,微软希望把自己的AI战略与社交媒体上备受批评的“成瘾式设计”区分开来。
微软首席执行官萨提亚·纳德拉公开反驳了一份内部备忘录,该备忘录据称建议把公司的新AI代理 Scout 设计得“刻意让人上瘾”。据《The Information》报道,纳德拉在发给约50名核心工程师的邮件中写道,让用户上瘾“绝对不是目标”。他表示,AI 应该赋能用户并创造真实价值,而不是操纵用户。纳德拉还补充说,他不知道这份文件是谁写的、又是谁泄露出去的,并暗示作者或许应该去别处工作。
根据 404 Media 的报道,这份备忘录被归因于企业副总裁 Omar Shahine,其中提出了一个三阶段计划,即从“上瘾应用”过渡到 agentic 平台。Scout 在微软 Build 大会上发布,基于开源软件 OpenClaw 构建。微软发言人 Frank Shaw 告诉《The Information》,Scout 的目标是帮助用户更高效地完成任务,并最终减少屏幕使用时间。公司同时强调,用户应当对自己如何与该代理交互拥有选择权和控制权,这与社交媒体产品中常见的成瘾式设计形成了对比。
这份备忘录据称出自企业副总裁 Omar Shahine,并提出了从“上瘾应用”到“agentic 平台”的三阶段路线图。Scout 在 Build 大会上亮相,基于开源软件 OpenClaw 构建,微软则表示它最终应减少屏幕使用时间,并让用户拥有更多选择和控制权。
The Decoder

据 The Decoder 引述模型技术论文和相关评论称,微软在其 MAI 模型的部分训练中使用了未经授权的网页数据,其中包括 Common Crawl。这与微软此前宣称这些模型只使用“企业级、干净且商业许可的数据”形成了冲突。
这则消息凸显了 AI 营销话术与真实训练数据做法之间日益扩大的差距,尤其涉及版权与透明度问题。它之所以重要,是因为企业、出版商和政策制定者越来越在意大模型到底用了什么数据,以及这些说法是否准确。
微软正因其 MAI 模型被曝部分使用了未经授权的网页数据而受到质疑。The Decoder 称,这些模型的技术论文显示微软使用了 Common Crawl 等数据源,这一点尤其值得注意,因为微软此前曾把这些模型宣传为仅使用“企业级、干净且商业许可的数据”。报道认为,这暴露了公司营销说法与实际训练集组成之间的不一致。微软在论文中把数据更宽泛地描述为“公开可用和已授权人工生成数据的混合”。
对于网页数据收集,微软表示自己使用了一个专有爬虫,会遵守 Robots Exclusion Protocol,包括 robots.txt 以及相关的元标签和 HTML 控制。文章指出,这种做法实际上把内容保护的责任更多地放在网站所有者身上,而关于抓取网页数据进行训练是否属于合理使用的法律问题,法院仍在裁定之中。因此,这件事更多是关于透明度、授权和 AI 训练数据法律灰区,而不是一项新的技术突破。报道的核心观点是,微软的做法与其他 AI 公司并无本质不同,但其对数据“更干净”的宣传并不符合实际。
文章称,微软把其网页数据描述为“公开可用和已授权人工生成数据的混合”,并表示其爬虫会遵守 robots.txt 及相关控制规则。但遵守 robots.txt 本身并不等于数据已获许可,而网页抓取训练数据在合理使用框架下的法律地位仍存在争议。