谷歌推出面向智能体的 Gemini 3.5 Flash

TechCrunch AI·5月20日 01:51 UTC·作者 Rebecca Bellan

关键信息

DeepMind 首席技术官 Koray Kavukcuoglu 表示，Gemini 3.5 Flash 在几乎所有基准上都超过了较新的 3.1 Pro，包括编程、智能体任务和多模态推理。谷歌还称它比其他前沿模型快 4 倍，且有一个在相同质量下快 12 倍的优化版本；这对需要并行处理、长时间运行的智能体工作流尤其关键。

资讯摘要

谷歌在 2026 年 Google I/O 上发布了 Gemini 3.5 Flash，并将其定位为迄今最强的编程和自主 AI 智能体模型。公司称它可以独立执行代码流水线、管理研究项目，甚至在内部测试中从零构建操作系统。这次发布表明谷歌正在从“聊天式 AI”转向更具行动能力的智能体 AI，让模型在更少人工监督下完成规划、执行和迭代。

若其表现符合宣传，开发者、企业和普通用户在编程、研究与流程自动化中的用法都可能被改变。 DeepMind 首席技术官 Koray Kavukcuoglu 表示，Gemini 3.5 Flash 在几乎所有基准上都超过了较新的 3.1 Pro，包括编程、智能体任务和多模态推理。谷歌还称它比其他前沿模型快 4 倍，且有一个在相同质量下快 12 倍的优化版本；这对需要并行处理、长时间运行的智能体工作流尤其关键。

资讯正文

谷歌周二发布了 Gemini 3.5 Flash，这是一款新的 AI 模型，公司称其是迄今为止在编码和自主 AI agent 方面最强大的模型。该模型在公司一年一度的 Google I/O 开发者大会上亮相，能够独立执行编码流水线、管理研究项目，并且在内部测试中从零开始构建出一套完整的操作系统。

这一发布标志着谷歌正在从把 AI 定位为对话工具，转向把 AI 定位为一种 agentic 工具。它不只是回答问题，而是在极少人工输入的情况下，规划、构建并迭代真实工作。

DeepMind 首席技术官 Koray Kavukcuoglu 在公开发布前的周一对记者表示：“3.5 Flash 兼具惊人的质量和低延迟。它在几乎所有基准测试中都优于我们最新的前沿模型 3.1 Pro，”其中包括编码、agentic 任务和多模态推理。

他补充说，它比其他前沿模型快 4 倍，这种速度非常适合编码和 agentic 任务，但谷歌通过开发一个与 Flash 质量相同、速度快 12 倍的优化版本，已经“把它提升到了另一个层级”。

Kavukcuoglu 表示，这种速度对 Flash 面向 agentic 工作的设计至关重要，因为在这类长时间运行的任务中，会有多个 AI agent 同时运行。在 I/O 现场，谷歌工程师 Varun Mohan 演示了多个 agent 分别承担不同组件的工作，随后再汇合起来，在公司的 agentic 开发平台和 IDE Antigravity 中构建一个完整的操作系统。

Kavukcuoglu 说，Flash 3.5 与 Antigravity 是共同开发的，这样这些 agent 就能拥有一个“它们可以生活、工作和执行的原生环境”。

在 I/O 上，谷歌发布了 Antigravity 2.0，这是一款围绕以 agent 优先的开发方式设计的独立桌面应用。

这些进展并不只体现在演示中。谷歌表示，3.5 Flash 的 agentic 能力已经在合作伙伴中产生影响，比如帮助银行和金融科技公司自动化持续数周的工作流程，或者帮助数据科学团队在复杂的数据环境中发现洞见。

该模型可以自主运行数小时，不过谷歌高级总监兼产品负责人 Tulsee Doshi 表示，当它遇到需要人类判断的决策点或权限问题时，有时会暂停并请求用户输入。

当谷歌发布即将推出的 3.5 Pro 模型时，这两者被设计为协同工作。

Doshi 告诉 TechCrunch：“3.5 Pro 会成为你的编排器、你的规划器，然后它实际上可以借助 Flash 作为各种子 agent。我认为关键在于，你真正希望把推理能力放在哪里；你究竟希望哪个更大的模型来真正推动推理，还是在哪些任务上，你确实需要很强的暴力式工具使用能力？”

目前，3.5 Flash 已成为 Gemini 应用和全球 Search 中 AI Mode 的默认模型。在 I/O 上，谷歌还宣布了将登陆 Search 的 agentic 能力，允许用户直接在平台上创建、定制和管理 AI agent。新模型也将为 Gemini Spark 提供支持；Gemini Spark 是谷歌全新的个人 AI agent，旨在全天候运行，帮助消费者管理他们的数字生活。

向普通消费者提供这种级别的 AI 能力也伴随着审视。谷歌目前正面临一桩诉讼：一名男子在去年与 Gemini 聊天数周后，几乎实施了一起大规模伤亡事件，并最终自杀身亡。

当更强大的自主代理被更广泛地开放使用时，潜在伤害的影响只会进一步扩大。谷歌表示，Gemini 3.5 已加强了网络安全以及 CBRN（化学、生物、放射性和核）防护措施，并且在应对敏感问题时进行了更好的校准，而不是直接拒绝回答。

Gemini 3.5 Flash 今天已通过 Antigravity、Gemini API 和 Gemini Enterprise 正式提供，同时也可通过 Gemini 应用和 Search 中的 AI 模式使用。

来源与参考

收录于 2026-05-20