Gemini 3.5 Flash 内置计算机使用

Google DeepMind News··作者 Mateo Quiros

关键信息

Google 表示,他们通过定向对抗训练来降低真实环境中的提示注入风险,同时还发布了两个可选的企业级防护措施:对敏感或不可逆操作要求用户明确确认,以及在检测到间接提示注入时自动停止任务。公司还建议将这些机制与沙箱隔离、人工复核和严格访问控制结合使用。

资讯摘要

Google 推出了 Gemini 3.5 Flash 的内置 computer use 功能,并称其为目前在代理式计算机使用任务上的最佳表现。此前,这项能力只作为独立的 Gemini 2.5 computer use 模型提供。现在,它已经被直接集成到 Gemini Flash 的主模型中。Google 表示,这使开发者能够构建自定义代理,让它们在浏览器、移动设备和桌面环境中观察屏幕、进行推理并采取行动。公司将其定位为长链路自动化的重要进展,包括持续软件测试以及面向专业应用的企业知识工作。

Google 还指出,Gemini 本身已经擅长 function calling,以及 Search 和 Maps grounding 等内置工具,而 computer use 则把代理能力扩展到了真实界面交互。为了展示这一能力,文章提到 3.5 Flash 可以分析 Gemini 应用并返回按类别整理的功能列表,也可以审计自己的文档以发现可访问性问题。在安全方面,Google 说它使用了定向对抗训练来缓解真实环境中的提示注入风险,并加入了两个可选的企业级保护措施:对敏感或不可逆操作要求用户确认,以及在检测到间接提示注入时自动停止任务。Google 建议开发者采用“纵深防御”策略,把这些机制与沙箱隔离、人工审核和严格访问控制结合起来。公司最后表示,已经有客户开始从 computer use 中获得价值,并引导开发者通过 Browserbase 的演示环境、Gemini API 以及 Gemini Enterprise Agent Platform 的参考实现和文档开始构建。

Gemini 3.5 Flash 内置计算机使用

资讯正文

在 Gemini 3.5 Flash 中引入电脑使用

3.5 Flash 使用电脑使用功能分析 Gemini 应用,并返回一个分类后的功能列表。

带有电脑使用功能的 3.5 Flash 会审计其自身文档中的可访问性问题。

让 3.5 Flash 中的电脑使用更安全

为减轻代理在真实环境中运行时面临的一些提示注入风险,我们对 Gemini 3.5 Flash 的电脑使用功能采用了有针对性的对抗训练。我们还发布了两套可选的企业级保护系统,使企业能够:

- 对敏感或不可逆操作要求用户明确确认。

- 如果识别到间接提示注入,则自动停止任务。

秉持“纵深防御”的方法,我们鼓励开发者将这些功能与安全的沙箱环境、人类在环验证以及严格的访问控制结合使用。有关安全措施的更多信息,请参阅我们的最佳实践文档。

我们已经看到客户利用电脑使用功能创造价值。以下是他们中的一些反馈:

要立即开始使用电脑使用进行构建:

- 立即试用:在 Browserbase 托管的演示环境中测试这些能力。

- 开始构建:通过 Gemini API 和 Gemini Enterprise Agent Platform 深入了解我们的参考实现和文档。

来源与参考

  1. 原始链接
  2. Introducing computer use in Gemini 3.5 Flash

收录于 2026-06-25