谷歌推出面向智能体的 Gemini 3.5 Flash

TechCrunch AI··作者 Rebecca Bellan

关键信息

DeepMind 首席技术官 Koray Kavukcuoglu 表示,Gemini 3.5 Flash 在几乎所有基准上都超过了较新的 3.1 Pro,包括编程、智能体任务和多模态推理。谷歌还称它比其他前沿模型快 4 倍,且有一个在相同质量下快 12 倍的优化版本;这对需要并行处理、长时间运行的智能体工作流尤其关键。

资讯摘要

谷歌在 2026 年 Google I/O 上发布了 Gemini 3.5 Flash,并将其定位为迄今最强的编程和自主 AI 智能体模型。公司称它可以独立执行代码流水线、管理研究项目,甚至在内部测试中从零构建操作系统。 这次发布表明谷歌正在从“聊天式 AI”转向更具行动能力的智能体 AI,让模型在更少人工监督下完成规划、执行和迭代。

若其表现符合宣传,开发者、企业和普通用户在编程、研究与流程自动化中的用法都可能被改变。 DeepMind 首席技术官 Koray Kavukcuoglu 表示,Gemini 3.5 Flash 在几乎所有基准上都超过了较新的 3.1 Pro,包括编程、智能体任务和多模态推理。谷歌还称它比其他前沿模型快 4 倍,且有一个在相同质量下快 12 倍的优化版本;这对需要并行处理、长时间运行的智能体工作流尤其关键。

谷歌推出面向智能体的 Gemini 3.5 Flash

资讯正文

谷歌周二发布了 Gemini 3.5 Flash,这是一款新的 AI 模型,公司称其是迄今为止在编码和自主 AI agent 方面最强大的模型。该模型在公司一年一度的 Google I/O 开发者大会上亮相,能够独立执行编码流水线、管理研究项目,并且在内部测试中从零开始构建出一套完整的操作系统。

这一发布标志着谷歌正在从把 AI 定位为对话工具,转向把 AI 定位为一种 agentic 工具。它不只是回答问题,而是在极少人工输入的情况下,规划、构建并迭代真实工作。

DeepMind 首席技术官 Koray Kavukcuoglu 在公开发布前的周一对记者表示:“3.5 Flash 兼具惊人的质量和低延迟。它在几乎所有基准测试中都优于我们最新的前沿模型 3.1 Pro,”其中包括编码、agentic 任务和多模态推理。

他补充说,它比其他前沿模型快 4 倍,这种速度非常适合编码和 agentic 任务,但谷歌通过开发一个与 Flash 质量相同、速度快 12 倍的优化版本,已经“把它提升到了另一个层级”。

Kavukcuoglu 表示,这种速度对 Flash 面向 agentic 工作的设计至关重要,因为在这类长时间运行的任务中,会有多个 AI agent 同时运行。在 I/O 现场,谷歌工程师 Varun Mohan 演示了多个 agent 分别承担不同组件的工作,随后再汇合起来,在公司的 agentic 开发平台和 IDE Antigravity 中构建一个完整的操作系统。

Kavukcuoglu 说,Flash 3.5 与 Antigravity 是共同开发的,这样这些 agent 就能拥有一个“它们可以生活、工作和执行的原生环境”。

在 I/O 上,谷歌发布了 Antigravity 2.0,这是一款围绕以 agent 优先的开发方式设计的独立桌面应用。

这些进展并不只体现在演示中。谷歌表示,3.5 Flash 的 agentic 能力已经在合作伙伴中产生影响,比如帮助银行和金融科技公司自动化持续数周的工作流程,或者帮助数据科学团队在复杂的数据环境中发现洞见。

该模型可以自主运行数小时,不过谷歌高级总监兼产品负责人 Tulsee Doshi 表示,当它遇到需要人类判断的决策点或权限问题时,有时会暂停并请求用户输入。

当谷歌发布即将推出的 3.5 Pro 模型时,这两者被设计为协同工作。

Doshi 告诉 TechCrunch:“3.5 Pro 会成为你的编排器、你的规划器,然后它实际上可以借助 Flash 作为各种子 agent。我认为关键在于,你真正希望把推理能力放在哪里;你究竟希望哪个更大的模型来真正推动推理,还是在哪些任务上,你确实需要很强的暴力式工具使用能力?”

目前,3.5 Flash 已成为 Gemini 应用和全球 Search 中 AI Mode 的默认模型。在 I/O 上,谷歌还宣布了将登陆 Search 的 agentic 能力,允许用户直接在平台上创建、定制和管理 AI agent。新模型也将为 Gemini Spark 提供支持;Gemini Spark 是谷歌全新的个人 AI agent,旨在全天候运行,帮助消费者管理他们的数字生活。

向普通消费者提供这种级别的 AI 能力也伴随着审视。谷歌目前正面临一桩诉讼:一名男子在去年与 Gemini 聊天数周后,几乎实施了一起大规模伤亡事件,并最终自杀身亡。

当更强大的自主代理被更广泛地开放使用时,潜在伤害的影响只会进一步扩大。谷歌表示,Gemini 3.5 已加强了网络安全以及 CBRN(化学、生物、放射性和核)防护措施,并且在应对敏感问题时进行了更好的校准,而不是直接拒绝回答。

Gemini 3.5 Flash 今天已通过 Antigravity、Gemini API 和 Gemini Enterprise 正式提供,同时也可通过 Gemini 应用和 Search 中的 AI 模式使用。

来源与参考

  1. 原始链接
  2. With Gemini 3.5 Flash, Google bets its next AI wave on agents, not chatbots | TechCrunch

收录于 2026-05-20