Google 发布 Gemini 3.5 Flash
Google AI Blog··作者 Koray Kavukcuoglu
关键信息
Google 表示,3.5 Flash 在多项基准上超过了 Gemini 3.1 Pro,包括 Terminal-Bench 2.1 的 76.2%、GDPval-AA 的 1656 Elo、MCP Atlas 的 83.6%,以及 CharXiv Reasoning 的 84.2%。谷歌还称它的输出 token 速度比其他前沿模型快约 4 倍,并计划在下个月推出已经内部使用中的 3.5 Pro。
资讯摘要
Google 宣布推出 Gemini 3.5,并将其描述为一个把前沿智能与行动能力结合起来的新模型家族,目标是推动更强大的智能代理。该系列的首个版本是 Gemini 3.5 Flash,谷歌称它在保持 Flash 系列一贯速度的同时,提供面向代理和编程任务的前沿性能。这个模型已经面向消费者开放,可通过 Gemini 应用和 Google Search 的 AI 模式使用。开发者则可以通过 Google Antigravity、Gemini API、Google AI Studio 和 Android Studio 接入。企业用户可以在 Gemini Enterprise Agent Platform 和 Gemini Enterprise 中使用它。谷歌还表示,Gemini 3.5 Pro 已经在内部使用,预计下个月正式推出。
谷歌公布的基准测试显示,3.5 Flash 在 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 和 CharXiv Reasoning 等项目上都超过了 Gemini 3.1 Pro。谷歌还称,它的输出 token 速度大约比其他前沿模型快 4 倍。公司借此强调,用户不再需要在质量和延迟之间做取舍。谷歌认为,这个模型尤其适合长周期代理任务,例如开发应用、维护代码库和准备财务文档。它还强调了与更新后的 Antigravity harness 结合后的能力,即在监督下让多个子代理协作完成多步骤工作流和编程任务。文章中的示例包括自动重命名和分类非结构化资产、在六小时内综合论文并编写可运行游戏、将旧代码库迁移到 Next.js,以及为 AI Studio 生成更丰富的网页界面和图形。

资讯正文
Gemini 3.5:具备行动能力的前沿智能
今天,我们推出 Gemini 3.5,这是我们最新一代兼具前沿智能与行动能力的模型系列。这标志着在打造更强大、更智能的智能体方面迈出了重大一步。我们将从发布 3.5 Flash 开始这一系列。它为智能体和编码带来前沿级表现,在能够产生现实世界价值的复杂长周期任务上表现尤为出色。
3.5 Flash 今天已面向全球数十亿人开放:
- 所有人都可通过 Gemini 应用以及 Google 搜索中的 AI Mode 使用
- 开发者可通过我们的以智能体为先的开发平台 Google Antigravity,以及 Google AI Studio 和 Android Studio 中的 Gemini API 使用
- 企业用户可通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。
我们也在全力推进 3.5 Pro。目前它已经在内部使用,我们期待下个月将其推出。
3.5 Flash:面向智能体和编码的前沿级表现
在 Artificial Analysis 指数中位列右上象限的 3.5 Flash,以极高速度提供前沿级智能——证明你不再需要在质量和延迟之间做取舍。
3.5 Flash:大规模智能体任务
这种速度与性能的平衡,使 3.5 Flash 非常适合处理长周期智能体任务。过去开发者可能需要几天、审计员可能需要几周才能完成的工作,现在 3.5 Flash 往往能在远短得多的时间内协助完成,而且成本通常不到其他前沿模型的一半。它能够快速规划、构建并迭代,解决现实世界中的问题,无论是开发新应用、维护代码库,还是协助准备财务文件。
当与更新后的 Antigravity harness 结合时,3.5 Flash 会成为一个强大的引擎,用于部署协作式子智能体,以应对最苛刻用例中的大规模问题。在监督下,它能够可靠地执行多步骤工作流和编码任务,同时保持前沿级表现。
借助 Antigravity,3.5 Flash 执行多步骤工作流,根据动态标准自动重命名并分类非结构化资产。
借助 Antigravity,3.5 Flash 使用两个智能体对 AlphaZero 论文进行综合,并在六小时内编写出一个可完整游玩的游戏。
3.5 Flash 利用 Antigravity harness 将一个杂乱的旧代码库迁移到 Next.js。
3.5 Flash 使用子智能体在 Antigravity 中创建新的城市景观。
3.5 Flash 使用两个智能体——一个构建者和一个玩家——在快速自我改进循环中协作,在 Antigravity 中开发一款游戏。
基于 Gemini 3 强大的多模态基础,3.5 Flash 能生成更丰富、更具交互性的网页 UI 和图形。
3.5 Flash 为 AI Studio 上的一篇研究论文创建交互式动画。
3.5 Flash 将一段纯文本描述转化为 AI Studio 上的交互式硬件。
3.5 Flash 并行执行多个概念,为 AI Studio 上的一场学校筹款活动打造完整的品牌方案。
3.5 Flash 在 AI Studio 上仅用 60 秒就为结账流程生成了不同的 UX 方案。
3.5 Flash:现实世界的影响
3.5 Flash 的现实世界代理能力已经在为我们的开发者和企业客户带来切实进展。在开发 3.5 模型系列时,我们与行业合作伙伴紧密合作,了解他们工作流程中的繁琐与复杂性究竟来自哪里。合作伙伴已经看到了显著影响——从银行和金融科技公司自动化持续数周的工作流程,到数据科学团队在复杂的数据环境中挖掘洞见。
Shopify 正在并行运行多个子代理,以在更长时间跨度上分析复杂数据,从而在全球规模上更准确地预测商家增长。
Macquarie Bank 正在试点 3.5 Flash 如何通过对 100 多页的复杂文档进行推理、检索相关信息并以低延迟给出可靠建议,加速客户开户注册。
Salesforce 正在将 3.5 Flash 集成到 Agentforce 中,通过部署多个能保留上下文并执行复杂多轮工具调用的子代理,可靠地自动化复杂的企业任务。
3.5 Flash 正在帮助 Ramp 借助对复杂发票的多模态理解,并结合对历史模式的推理,实现更智能、更可靠的 OCR。
Xero 正在部署代理,自动管理复杂、持续数周的工作流程,例如识别供应商并为 1099 税表收集信息,从而让小企业能够自动化繁琐的行政工作。
Databricks 正在使用代理式工作流来监控并检索实时信息,在海量数据集之间进行推理,以诊断问题、识别修复方案,并为数据科学家提出解决办法。
个人 AI 代理:由 3.5 Flash 构建
3.5 Flash 现已成为全球 Gemini 应用和 Search 中 AI Mode 的默认模型。在今天的 I/O 大会上,我们展示了它的代理能力如何驱动新功能,把前沿级智能带入你的日常生活。
全新的 Gemini Spark——你的个人 AI 代理——采用 3.5 Flash。它 24/7 运行,在你的指引下代你采取行动,帮助你管理数字生活。我们今天开始向受信任测试者推出 Gemini Spark,并计划于下周向美国的 Google AI Ultra 订阅用户提供 Beta 版。
Gemini Spark 使用 3.5 Flash 来帮助完成这些任务
3.5 Flash 增强后的代理式编码能力也在 Search 中带来更智能的体验,从引入全天候为你工作的全新信息代理,到解锁更动态的生成式 UI 体验。更多内容请参见我们的博客文章。
Search 利用 3.5 Flash 构建了一个解释 Gyroid 图案的交互式可视化界面。
Gemini 3.5:内置前沿级安全防护
Gemini 3.5 是按照我们的 Frontier Safety Framework 开发的。我们加强了网络安全以及 CBRN 防护,这意味着它不太可能生成有害内容,也不太可能错误地拒绝回答安全查询。我们通过新的、更先进的安全训练和缓解措施来实现这一点,其中包括可解释性工具,帮助在 AI 给出回应之前检查并理解其内部推理。
3.5 Flash 现已可用
Gemini 3.5 Flash 现已通过 Google Antigravity、Google AI Studio 和 Android Studio 中的 Gemini API、Gemini Enterprise Agent Platform 以及 Gemini Enterprise 正式提供。它现在也已向 Gemini 应用和 Search 中的 AI Mode 的所有用户开放。谨代表整个 Gemini 团队,我们迫不及待地想看到你会构建出什么。
来源与参考
收录于 2026-05-20