Gemini 3.5 Flash 内置计算机使用

Google DeepMind News·6月25日 00:30 UTC·作者 Mateo Quiros

关键信息

Google 表示，他们通过定向对抗训练来降低真实环境中的提示注入风险，同时还发布了两个可选的企业级防护措施：对敏感或不可逆操作要求用户明确确认，以及在检测到间接提示注入时自动停止任务。公司还建议将这些机制与沙箱隔离、人工复核和严格访问控制结合使用。

资讯摘要

Google 推出了 Gemini 3.5 Flash 的内置 computer use 功能，并称其为目前在代理式计算机使用任务上的最佳表现。此前，这项能力只作为独立的 Gemini 2.5 computer use 模型提供。现在，它已经被直接集成到 Gemini Flash 的主模型中。Google 表示，这使开发者能够构建自定义代理，让它们在浏览器、移动设备和桌面环境中观察屏幕、进行推理并采取行动。公司将其定位为长链路自动化的重要进展，包括持续软件测试以及面向专业应用的企业知识工作。

Google 还指出，Gemini 本身已经擅长 function calling，以及 Search 和 Maps grounding 等内置工具，而 computer use 则把代理能力扩展到了真实界面交互。为了展示这一能力，文章提到 3.5 Flash 可以分析 Gemini 应用并返回按类别整理的功能列表，也可以审计自己的文档以发现可访问性问题。在安全方面，Google 说它使用了定向对抗训练来缓解真实环境中的提示注入风险，并加入了两个可选的企业级保护措施：对敏感或不可逆操作要求用户确认，以及在检测到间接提示注入时自动停止任务。Google 建议开发者采用“纵深防御”策略，把这些机制与沙箱隔离、人工审核和严格访问控制结合起来。公司最后表示，已经有客户开始从 computer use 中获得价值，并引导开发者通过 Browserbase 的演示环境、Gemini API 以及 Gemini Enterprise Agent Platform 的参考实现和文档开始构建。

资讯正文

在 Gemini 3.5 Flash 中引入电脑使用

3.5 Flash 使用电脑使用功能分析 Gemini 应用，并返回一个分类后的功能列表。

带有电脑使用功能的 3.5 Flash 会审计其自身文档中的可访问性问题。

让 3.5 Flash 中的电脑使用更安全

为减轻代理在真实环境中运行时面临的一些提示注入风险，我们对 Gemini 3.5 Flash 的电脑使用功能采用了有针对性的对抗训练。我们还发布了两套可选的企业级保护系统，使企业能够：

- 对敏感或不可逆操作要求用户明确确认。

- 如果识别到间接提示注入，则自动停止任务。

秉持“纵深防御”的方法，我们鼓励开发者将这些功能与安全的沙箱环境、人类在环验证以及严格的访问控制结合使用。有关安全措施的更多信息，请参阅我们的最佳实践文档。

我们已经看到客户利用电脑使用功能创造价值。以下是他们中的一些反馈：

要立即开始使用电脑使用进行构建：

- 立即试用：在 Browserbase 托管的演示环境中测试这些能力。

- 开始构建：通过 Gemini API 和 Gemini Enterprise Agent Platform 深入了解我们的参考实现和文档。

来源与参考

收录于 2026-06-25