Google 全面推出 Gemini 3.5 Flash

Simon Willison·5月20日 06:40 UTC·作者 Simon Willison

关键信息

该模型的 ID 是 gemini-3.5-flash，知识截止时间为 2025 年 1 月，支持 1,048,576 个输入 token 和 65,536 个最大输出 token。与之前的 Flash 模型相比，它价格明显更高，并且不支持 computer use；同时 Google 还在推广处于 beta 阶段的 Interactions API，提供服务端历史管理。

资讯摘要

在 Google I/O 上，Google 发布了 Gemini 3.5 Flash，并且没有把它标记为预览版，而是直接进入正式可用。Google 表示，这个模型已经通过 Gemini 应用和 Google Search 的 AI Mode 向全球数十亿用户开放，也会提供给开发者在 Google Antigravity、Google AI Studio 的 Gemini API 以及 Android Studio 中使用。企业用户则可以通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 获得访问权限。开发者文档显示，该模型的 ID 是 gemini-3.5-flash，知识截止时间为 2025 年 1 月，支持 1,048,576 个输入 token 和 65,536 个最大输出 token。

它大体延续了 Gemini 3.x 系列的功能，但不包含 computer use。Google 还在推广一个处于 beta 阶段的 Interactions API，看起来类似 OpenAI Responses 的模式，尤其强调服务端历史管理。最引人注意的是价格上涨：Gemini 3.5 Flash 的价格大约是 Gemini 3 Flash Preview 的 3 倍，也是 Gemini 3.1 Flash-Lite 的 6 倍。按每百万输入 token 1.50 美元、每百万输出 token 9 美元计算，它的价格已经接近 Gemini 3.1 Pro，而 Google 还表示 Gemini 3.5 Pro 将在下个月推出。

资讯正文

今天在 Google I/O 上，Google 发布了 <a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/">Gemini 3.5 Flash</a>。这次它跳过了 <code>-preview</code> 后缀，直接进入正式可用（general availability）阶段，而且 Google 似乎已经把它用在了他们许多关键产品中：

3.5 Flash 今天已面向全球数十亿人开放：

- 所有人都可通过 Gemini 应用，以及 <a href="https://blog.google/products-and-platforms/products/search/search-io-2026">Google Search</a> 中的 AI Mode 使用

- 开发者可在我们的 agent-first 开发平台 Google Antigravity，以及 Google AI Studio 和 Android Studio 中的 Gemini API 上使用

- 企业用户可在 Gemini Enterprise Agent Platform 和 Gemini Enterprise 中使用。

和 Gemini 一贯的风格一样，最有意思的细节都藏在 <a href="https://ai.google.dev/gemini-api/docs/whats-new-gemini-3.5">Gemini 3.5 Flash 的更新说明</a>开发者文档里。它基本上保留了此前 Gemini 3.x 系列的那套平台功能，只是没有 <a href="https://ai.google.dev/gemini-api/docs/computer-use">computer use</a>。模型 ID 是 <code>gemini-3.5-flash</code>。知识截止时间是 2025 年 1 月，支持 1,048,576 个输入 token 和 65,536 个最大输出 token。

Google 还在推进一个新的 <a href="https://ai.google.dev/gemini-api/docs/interactions">Interactions API</a>，目前处于 beta 版。在我看来，这看起来像是他们对 <a href="https://developers.openai.com/api/reference/responses/overview">OpenAI Responses</a> 引入的模式所做的对应实现——尤其是服务端历史记录管理。

The price has gone up

按每百万输入 token 1.50 美元、每百万输出 token 9 美元计算，它在价格上已经接近 Google 的 Gemini 3.1 Pro，后者分别是 2 美元和 12 美元。

Gemini 团队承诺 3.5 Pro 将在“下个月”推出——想必价格会更高。

考虑到这次涨价，Google 仍然把它推向这么多面向消费者的免费产品，这一点颇有意思。感觉三家主要的 AI 实验室都开始试探 API 客户的价格承受能力了。

Artificial Analysis 会发布在各模型上运行其专有基准测试的成本，这是一种很有用的方法，可以把诸如分词方式以及更多推理 token 带来的用量增加等因素考虑进去。下面有一些值得比较的数据：

- <a href="https://artificialanalysis.ai/models/gemini-3-5-flash">Gemini 3.5 Flash（high）</a>：1,551.60 美元

Gemini 3.1 Pro Preview：892.28 美元

Gemini 3 Flash Preview（Reasoning）: 278.26 美元

Gemini 3.1 Flash-Lite Preview：93.60 美元

运行 3.5 Flash（high）的基准测试，成本比 3.1 Pro Preview 高得多！

以下是其他供应商的一些数字：

Claude Opus 4.7（Adaptive Reasoning，Max Effort）：5,117.14 美元

Claude Opus 4.7（Non-reasoning，High Effort）：1,217.23 美元

GPT-5.5（xhigh）：3,357.00 美元

GPT-5.5（medium）：1,199.14 美元

一只骑自行车的鹈鹕

我把“生成一只骑自行车的鹈鹕的 SVG”提交给 Gemini API，得到的这只鹈鹕，真是相当多：

从代码注释来看：<code></code>

Hacker News 上的 hedgehog 说：

“那只鹈鹕看起来像是在迈阿密参加加密货币大会。”

这一次我用了 11 个输入 token 和 14,403 个输出 token，总成本不到 13 美分。

来源与参考

收录于 2026-05-21