谷歌押注自己能让 AI 代理真正有用

The Verge AI··作者 Hayden Field

关键信息

Gemini Spark 设计为在云端持续运行,可在网页、Android 和 iOS 之间同步,并与谷歌服务及 30 多个外部合作伙伴协同工作,例如 Dropbox、Uber 和 Spotify。文章还指出,谷歌正借助类似 MCP 的集成方式和自身产品生态,这可能比 OpenClaw 依赖应用的方式更具优势。

资讯摘要

文章认为,AI 代理长期以来一直被描绘成“个人助手”,但过去很多年里,它们更像不可靠的实习生,而不是真正有用的工具。过去六个月里,这一局面开始变化,主要原因是开源 AI 代理平台 OpenClaw 的迅速走红,它证明了代理式工作流在实践中确实可能有用。OpenClaw 的成功让各大 AI 实验室迅速提高了对代理产品的重视程度,而 OpenAI 也在 2 月收购了 OpenClaw,并聘请其创建者 Peter Steinberger。The Verge 认为,谷歌现在尤其有机会把这股趋势转化为面向大众的产品。谷歌在 I/O 2026 上宣布了用于信息收集、活动规划、邮箱和日历摘要等任务的代理,同时还扩展了开发者工具,并为 Search 增加了更多生成式 AI 功能。

谷歌的新消费者代理 Gemini Spark 旨在覆盖谷歌自身服务以及 30 多个外部合作伙伴,而且它可以在云端 24 小时运行,不需要用户一直开着笔记本电脑。文章强调,谷歌最大的优势在于其现成的生态系统:它可以深度连接 Gmail、Drive、Docs、Photos、Search 等产品,而这些产品本身就已经掌握了大量用户的数字生活信息。Google DeepMind CTO Koray Kavukcuoglu 对 The Verge 表示,过去 AI 代理更多还是研究概念,但今年他希望它们能真正进入日常生活。文章最后指出,如果谷歌的方案真的如其所说那样有效,那么这可能会成为 AI 代理在大规模场景下变得真正有用的重要一步。

谷歌押注自己能让 AI 代理真正有用

资讯正文

多年来,科技公司一直承诺,AI 将为每个人提供一个称职的私人助理,但最终交付的却更像是一个什么都不懂的实习生。在过去六个月里,这种情况开始发生变化,这在很大程度上要归功于病毒式传播的开源 AI agent 平台 OpenClaw。而在如今追逐类似成功的顶级 AI 实验室中,有一家似乎尤其有望让 agent 在大规模场景中真正发挥作用:Google。

在 I/O 2026 上,Google 发布了新的 AI agents,用于收集信息、规划活动、总结你的收件箱和日历等。这些 agents 可以在后台持续运行,公司称它们将无缝集成到 Google 自家的工具以及外部工具中。Google 还在扩展其开发者工具,并通过增加生成式 AI 功能来改造 Search。其中一些功能本周开始推出,另一些将在未来几个月内可用,但公司的策略似乎很明确:吸收一些帮助 OpenClaw 取得成功的特性,并借助 Google 对我们数字足迹的深刻了解将其放大。

Google DeepMind 的 CTO、Google 首席 AI 架构师 Koray Kavukcuoglu 在接受 The Verge 采访时表示:“在这之前,我认为 AI agents 更多还是研究中的一个概念。”他希望今年它们会“真正走进我们的生活”。

自从 2022 年底 ChatGPT 发布后不久,AI agents 就成了一个流行词,但在 OpenClaw 崛起之前,它们大多仍只是一个科幻概念。OpenClaw 自去年 11 月推出以来已经吸引了数百万用户。OpenClaw 让人们可以通过 WhatsApp 和 Telegram 等日常应用与自己的 agents 聊天,并且(只要笔记本电脑开着)这些 agents 就可以全天候运行。它们的表现足以可靠地处理基础任务,尽管也存在一些明显缺陷。

这让所有 AI 实验室都立刻高度关注起来,而 OpenAI 是最早采取行动的参与者之一:它在 2 月收购了 OpenClaw(尽管它仍然是开源的),并聘请了其创始人 Peter Steinberger。但 Google 现有的服务帝国让它占据了巨大优势。OpenClaw 是通过与人们已经在使用的工具集成来推动普及,而 Google 也能通过 MCP 做到这一点——但它还可以在自有产品套件中建立更深层次的连接,包括 Gmail、Drive、Docs、Photos 和 Search。要说有什么令人意外的,大概只是这件事发生得太晚了。

Google 今年的一大押注是 Gemini Spark,这是面向消费者的新 AI agent。Google 承诺,Gemini Spark 可以跨越 Google 自家的服务以及即将接入的 30 多个外部合作伙伴执行任务,其中包括 Dropbox、Uber 和 Spotify。Gemini Spark 基于云端;它可以在不保持笔记本电脑开启的情况下 24/7 运行,并可在网页、Android 和 iOS 之间同步。该 agent 本周将向受信任测试者推出,下周将在美国面向 Google 的 Ultra 订阅计划提供 beta 版本。

Google 宣传 Gemini Spark 的典型用途,比如购物、做研究,以及协调他人的日程和计划。Google 也希望人们能找到自己的用法。Google 的 Gemini 应用负责人 Josh Woodward 说,他一直在用 Gemini Spark 策划一场社区街区派对,让这些代理去跟踪报名回复以及参加者会带什么、发送提醒,并弄清楚他所在的业主协会什么时候允许摆放一个巨大的充气装置。除了 Spark 之外,Google 还在推出 Daily Brief,一种类似 OpenAI 的 ChatGPT Pulse 的晨间更新。

Gemini Spark 目前还不可用,但如果它真的按 Google 所说的那样运作,它可能会让传统科技公司的 AI 代理向前迈出一大步。Google 最早的 agentic 实验完成任务的速度慢得像蜗牛,同时还会劫持你的浏览器。到了去年的 Gemini 3 发布时,它的代理在某些工作上表现不错——比如清理收件箱——但在其他任务上仍然失败。现在,Google 正在迈出一个有前景的步骤:借鉴 OpenClaw 的一些关键要素,让长时间运行的代理在后台全天候运作,从而使它们能够对自己的任务拥有更多上下文——也让用户能够直接给自己的代理发短信和电子邮件。

从今年夏天开始,Google 的 AI 搜索也将加入代理——并承诺终于不再只是占满屏幕空间、以及推荐“胶水披萨”了。它的“信息代理”本应执行持续的后台研究——比如追踪股市变化,或查看天气以寻找最适合野餐的日子。

Google 还宣布扩展 Antigravity,这个平台化的 agentic 开发平台是它大约六个月前推出的。Google 表示,新的独立 Antigravity 桌面应用将作为代理交互的中心枢纽,而整个系统现在被设计成一个用于构建和管理自主代理的平台。此次扩展紧随 OpenAI 和 Anthropic 的类似工具之后,这两家公司一直试图把各自成功的编程服务扩展成更适合非程序员的、更易上手的工具。

在 AI 智能体的世界里,Google 仍然会在与 OpenClaw 背后那支“独苗”团队的竞争中处于追赶位置。不过,Google 是 AI 竞赛中长期的领先者,而且它的应用还拥有规模优势:公司高管周一告诉记者,该应用目前每月服务超过 9 亿用户,覆盖 230 多个国家和地区以及 70 多种语言。与那些正承受越来越大财务压力的专门 AI 公司相比,Google 至少可以在一段时间内通过补贴成本来吸引用户。而且,虽然它的智能体还没有经历现实世界的考验,但它们正朝着一个有前景的方向前进。如果有哪家 AI 公司能够让智能体真正变得有用,那就是 Google。如果连 Google 都做不到,它也就没太多借口可找了——整个想法或许也需要重新思考。

来源与参考

  1. 原始链接
  2. If Google can’t make AI agents useful, maybe no one can

收录于 2026-05-21