谷歌发布第八代TPU、代理平台与Workspace AI层
The Decoder··作者 Maximilian Schreiner
关键信息
TPU 8i通过更多片上SRAM加快推理时的关键值缓存访问速度;Virgo网络支持跨数据中心连接多达一百万个TPU,目标是实现约97%的高效算力利用率(goodput)。
资讯摘要
在Cloud Next '26大会上,谷歌宣布了三项重大AI进展:第八代TPU首次分为训练(TPU 8t)和推理(TPU 8i)芯片,新的Gemini企业代理平台用于创建具备长期记忆和加密身份的自主AI代理,以及Workspace Intelligence,将Gmail、Docs和Drive中的数据打通。谷歌采用光学交换技术连接多达一百万个TPU,目标是实现高效率(约97%的好用率)。
代理平台包含Agent Studio等自然语言创建工具及沙箱环境,确保安全执行。这些举措使谷歌在企业AI基础设施和自主代理开发领域更具竞争力。

资讯正文
Google在Cloud Next '26大会上发布了第八代TPU、代理平台和Workspace AI层。
关键要点:
- 这是谷歌首次将第八代TPU拆分为用于训练和推理的独立芯片。与追求单芯片峰值性能不同,该公司选择通过规模取胜,将多达一百万个芯片连接成大规模集群。
- 新推出的Gemini Enterprise代理平台旨在简化自主AI代理的创建和安全运行。该平台为代理提供长期记忆功能,支持多步骤流程,并通过加密身份和异常检测来保障系统安全。
- 谷歌还推出了Workspace Intelligence,这是一个集中连接Gmail、Docs和Drive等应用信息的层级,使AI模型能够理解跨多个应用的关系。
谷歌利用Cloud Next '26大会发布了第八代TPU、改进后的代理平台以及Workspace的新AI层。公司以“代理型企业”(Agentic Enterprise)作为整体推广口号。
这是谷歌首次将张量处理单元(TPU)分为两种型号:TPU 8t用于训练,TPU 8i用于推理。根据谷歌AI与基础设施高级副总裁兼首席技术官Amin Vahdat的说法,这一举措是对代理类模型日益增长的推理需求的回应——这些模型会循环地规划、执行和学习。
相比英伟达,谷歌更注重规模化而非单芯片原始性能。正如《注册报》(The Register)指出,英伟达即将推出的Rubin GPU每颗芯片的计算能力和内存带宽都显著高于TPU 8t。但在训练前沿模型时,真正重要的是你能否高效地连接大量芯片。
据《注册报》称,这正是谷歌的优势所在。英伟达最新的GPU在一个NVLink域内最多可连接576个加速器,之后才启用较慢的以太网或InfiniBand连接;而谷歌则使用光电路交换技术,在单个机柜中连接9600个TPU。其新的Virgo网络还能将多个数据中心整合成高达一百万个TPU的集群。一个托管的Lustre存储系统可直接将数据推入加速器内存。谷歌的目标是实现约97%的‘有效吞吐率’——即芯片实际用于训练的时间占比,而非等待检查点或从错误中恢复的时间。
TPU 8i推理芯片在计算能力上有所让步,但增加了片上SRAM容量并提升了HBM速度。更大的SRAM可以将更多关键值缓存(本质上是模型对先前响应的记忆)保留在芯片内部,从而避免核心因等待数据而闲置。谷歌还开发了一个名为Collective Acceleration Engine的组件,专门用于加速混合专家模型。此外,谷歌设计了一种名为Boardfly的网络拓扑结构,用以降低芯片间的延迟。
这两个TPU现在首次基于谷歌自研的Arm架构Axion CPU运行。
在软件方面,谷歌将现有的AI服务整合进Gemini Enterprise Agent Platform,该平台基于Vertex AI构建。开发者可以使用一款工具来绘制多个代理如何协同工作的流程图,还有一个名为Agent Studio的界面,可通过自然语言创建代理。一个中央注册表旨在防止组织出现数十个几乎相同的代理。
对于运行代理,谷歌瞄准了众所周知的薄弱环节。长时间运行的代理现在可以独立处理多步骤流程,而无需在每个步骤都暂停等待人工输入。沙盒测试环境使代理能够执行自己的代码或浏览器自动化操作,同时不会危及主机系统。内存银行为代理提供长期记忆,使其不会在每次会话时都从零开始。
由于自主代理带来了新的攻击面,谷歌也随附了相应的控制措施:为每个代理分配加密身份,通过上游过滤器防范提示注入攻击,并检测异常行为(如未经授权的数据访问或永不停止的推理循环)。模拟工具让团队可以在代理接触真实客户之前,用合成用户交互进行测试。这些防护措施的实际效果仍有待观察。
可用模型包括Gemini 3.1 Pro、Nano Banana 2、Lyria 3,以及Anthropic的Claude Opus、Sonnet、Haiku和新加入的Claude Opus 4.7。
配套的Gemini Enterprise应用面向终端用户:员工可以从模块化组件中自行组装代理,在类似收件箱的视图中跟踪正在进行的任务,并直接在应用内编辑文档。
Workspace Intelligence作为共享知识层
与此同时,谷歌还推出了Workspace Intelligence,这是一个连接Gmail、Docs、Drive、Meet和Chat内容的层级。其理念是,Gemini及在其基础上构建的代理能够理解邮件、会议、聊天记录和文件之间的关联关系,而不是孤立地查询各个应用。
在Gmail中,Gemini会整理收到的消息并总结主题;在Google Chat中,用户可以直接从对话中创建日历事件或文档;在Docs中,Gemini可从邮件和文件中起草内容;在Sheets中,它能生成仪表板;在Slides中,则自动组合演示文稿。Drive Projects将文件和邮件按主题分组到工作区中。对于希望迁移的企业,谷歌还提供了比微软365更快的迁移路径。
来源与参考
收录于 2026-04-23