Google 全面推出 Gemini 3.5 Flash
Simon Willison··作者 Simon Willison
关键信息
该模型的 ID 是 gemini-3.5-flash,知识截止时间为 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。与之前的 Flash 模型相比,它价格明显更高,并且不支持 computer use;同时 Google 还在推广处于 beta 阶段的 Interactions API,提供服务端历史管理。
资讯摘要
在 Google I/O 上,Google 发布了 Gemini 3.5 Flash,并且没有把它标记为预览版,而是直接进入正式可用。Google 表示,这个模型已经通过 Gemini 应用和 Google Search 的 AI Mode 向全球数十亿用户开放,也会提供给开发者在 Google Antigravity、Google AI Studio 的 Gemini API 以及 Android Studio 中使用。企业用户则可以通过 Gemini Enterprise Agent Platform 和 Gemini Enterprise 获得访问权限。开发者文档显示,该模型的 ID 是 gemini-3.5-flash,知识截止时间为 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。
它大体延续了 Gemini 3.x 系列的功能,但不包含 computer use。Google 还在推广一个处于 beta 阶段的 Interactions API,看起来类似 OpenAI Responses 的模式,尤其强调服务端历史管理。最引人注意的是价格上涨:Gemini 3.5 Flash 的价格大约是 Gemini 3 Flash Preview 的 3 倍,也是 Gemini 3.1 Flash-Lite 的 6 倍。按每百万输入 token 1.50 美元、每百万输出 token 9 美元计算,它的价格已经接近 Gemini 3.1 Pro,而 Google 还表示 Gemini 3.5 Pro 将在下个月推出。

资讯正文
今天在 Google I/O 上,Google 发布了 <a href="https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/">Gemini 3.5 Flash</a>。这次它跳过了 <code>-preview</code> 后缀,直接进入正式可用(general availability)阶段,而且 Google 似乎已经把它用在了他们许多关键产品中:
3.5 Flash 今天已面向全球数十亿人开放:
- 所有人都可通过 Gemini 应用,以及 <a href="https://blog.google/products-and-platforms/products/search/search-io-2026">Google Search</a> 中的 AI Mode 使用
- 开发者可在我们的 agent-first 开发平台 Google Antigravity,以及 Google AI Studio 和 Android Studio 中的 Gemini API 上使用
- 企业用户可在 Gemini Enterprise Agent Platform 和 Gemini Enterprise 中使用。
和 Gemini 一贯的风格一样,最有意思的细节都藏在 <a href="https://ai.google.dev/gemini-api/docs/whats-new-gemini-3.5">Gemini 3.5 Flash 的更新说明</a>开发者文档里。它基本上保留了此前 Gemini 3.x 系列的那套平台功能,只是没有 <a href="https://ai.google.dev/gemini-api/docs/computer-use">computer use</a>。模型 ID 是 <code>gemini-3.5-flash</code>。知识截止时间是 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个最大输出 token。
Google 还在推进一个新的 <a href="https://ai.google.dev/gemini-api/docs/interactions">Interactions API</a>,目前处于 beta 版。在我看来,这看起来像是他们对 <a href="https://developers.openai.com/api/reference/responses/overview">OpenAI Responses</a> 引入的模式所做的对应实现——尤其是服务端历史记录管理。
The price has gone up
按每百万输入 token 1.50 美元、每百万输出 token 9 美元计算,它在价格上已经接近 Google 的 Gemini 3.1 Pro,后者分别是 2 美元和 12 美元。
Gemini 团队承诺 3.5 Pro 将在“下个月”推出——想必价格会更高。
考虑到这次涨价,Google 仍然把它推向这么多面向消费者的免费产品,这一点颇有意思。感觉三家主要的 AI 实验室都开始试探 API 客户的价格承受能力了。
Artificial Analysis 会发布在各模型上运行其专有基准测试的成本,这是一种很有用的方法,可以把诸如分词方式以及更多推理 token 带来的用量增加等因素考虑进去。下面有一些值得比较的数据:
- <a href="https://artificialanalysis.ai/models/gemini-3-5-flash">Gemini 3.5 Flash(high)</a>:1,551.60 美元
Gemini 3.1 Pro Preview:892.28 美元
Gemini 3 Flash Preview(Reasoning): 278.26 美元
Gemini 3.1 Flash-Lite Preview:93.60 美元
运行 3.5 Flash(high)的基准测试,成本比 3.1 Pro Preview 高得多!
以下是其他供应商的一些数字:
Claude Opus 4.7(Adaptive Reasoning,Max Effort):5,117.14 美元
Claude Opus 4.7(Non-reasoning,High Effort):1,217.23 美元
GPT-5.5(xhigh):3,357.00 美元
GPT-5.5(medium):1,199.14 美元
一只骑自行车的鹈鹕
我把“生成一只骑自行车的鹈鹕的 SVG”提交给 Gemini API,得到的这只鹈鹕,真是相当多:
从代码注释来看:<code><!-- 鹈鹕眼睛 / 太阳镜(酷炫复古飞行员款) --></code>
Hacker News 上的 hedgehog 说:
“那只鹈鹕看起来像是在迈阿密参加加密货币大会。”
这一次我用了 11 个输入 token 和 14,403 个输出 token,总成本不到 13 美分。
来源与参考
收录于 2026-05-21