Gemini Spark 表现惊艳但引发成本与隐私担忧

The Verge AI··作者 Jay Peters

关键信息

评测强调,Spark 的设计目标是在用户指挥下运行,在执行重大操作前先确认,并能在后台处理多步骤任务。与此同时,它也暴露出一个重要隐忧:系统可以非常擅长查找个人数据并串联各项服务,这让隐私和成本上的取舍更难忽视。

资讯摘要

The Verge 上手测试了 Google 新推出的 Gemini Spark,这是一款 Google 定位为可 24/7 在后台代用户工作的 AI agent。Google 把它描述为始终受用户指挥、只有在用户主动开启时才会运行,并且在执行重大操作前会先征求确认。作者首先复现了 Google I/O 上的演示场景,想看看它在普通家庭办公环境里是否也能表现一致。第一个测试要求 Spark 根据保存在 Drive 中的 2026 年预算表,给作者的妻子起草一封邮件,但作者没有告诉它妻子的名字,也没有告诉它文件在哪里。

Spark 成功找到了妻子的邮箱地址,定位到正确的表格,提取月度杂货支出并计算平均值,然后在 Gmail 里生成了一封草稿,甚至还用了只有夫妻之间才会用的称呼和落款。第二个关于街区派对筹备的测试就没有那么顺利,它生成了一张“朋友和家人”的表格,还写了一封提到并不存在的报名表的邮件,甚至做出了一份关于城市许可的难看幻灯片。后来作者让它创建缺失的报名表并把链接加回邮件里,Spark 经过几分钟处理后最终完成了这项任务。第三个更复杂的演示式请求同时涉及日历、邮件和文档,作者在文章时间线内表示它仍在处理之中,这也说明它既有很强的潜力,也有明显的局限。

Gemini Spark 表现惊艳但引发成本与隐私担忧

资讯正文

谷歌新的“24/7”AI 代理 Gemini Spark,做起替你办事来可以说惊人地好。但我不确定它是否值得那样的经济成本以及潜在的隐私权衡。

谷歌上周让我试用了 Spark。谷歌将 Spark 宣传为一款 AI 代理,能够接手任务并在后台执行——即使是包含多个步骤的任务也可以——让你把手机放下,或者离开电脑。Spark 网站最上方还写着,它“始终受你指挥”,“由你选择开启它”,而且“设计上会在采取重大行动之前先向你确认”。考虑到人们对 AI 日益增长的怀疑,这说法很像“我这件‘我没参与失控 AI’T 恤已经让人们提出一些我衣服上都已经回答过的问题了”。

我一开始不知道从哪里下手,于是借鉴了同事 Antonio 的做法:我决定用 Spark 去处理一些类似谷歌在 I/O 现场演示的任务。它在我的家庭办公室里,会和在大舞台上一样好用吗?

[图片:谷歌的 Josh Woodward 正在演示 Spark。https://platform.theverge.com/wp-content/uploads/sites/2/2026/06/lcimg-f4e04b1d-fa8e-4d4c-86f7-ac5a5c4fd0ad.jpeg?quality=90&strip=all]

在 I/O 上,谷歌副总裁 Josh Woodward 展示了几个不同的例子。第一个是让 Spark 起草一封发给谷歌某个团队的电子邮件,汇总 Gemini Live 的发布以及“上周的‘胜利’”相关的一切内容,并使用一个专门的 AI 技能让邮件听起来像他本人写的。谷歌让谷歌为谷歌做事,这本该是世界上最轻松的任务,所以我决定把难度再往上提。

我让 Gemini 起草一封发给我妻子的邮件,汇总我们 2026 年每月平均买菜支出总额。我觉得这个测试能告诉我几件事:Spark 能不能判断出我妻子是谁(在我没有把她的名字告诉 Spark 的情况下),它能不能在 Drive 里找到我们的预算电子表格(文件名里并没有“budget”这个词),以及它能不能真的在 Gmail 里起草一封邮件。

不久后我从 Spark 那里拿到结果时,我真的说了句:“哇,这也太离谱了。”Spark 找到了我妻子的电子邮件地址,从我们 2026 年的预算电子表格中提取了正确的信息,抓取了每月买菜总额,包括 5 月份尚未完成的数据(我测试时 5 月还没有结束),计算出了平均值,并把所有内容都放进了我 Gmail 里的草稿邮件中。邮件正文甚至还直接用我妻子的名字称呼她,尽管她的邮箱地址里并不包含她的名字。它甚至还加上了一个只有我们彼此才会使用的结尾落款。

在他的下一个例子里,Woodward 请求帮忙筹划一次街区派对。我并没有要办街区派对,但我还是用他提出的同样问题让 Spark 帮忙。结果并不理想。它制作了一张把朋友和家人列出来的表格,称其为“谁带什么的高度逼真参考”,在我的 Gmail 里起草了一封提到一个并不存在的共享报名表的邮件,还做了一个很难看的演示文稿,其中几页幻灯片详细说明了有关城市许可证的信息。

为了测试 Spark,我让它创建那张缺失的报名表,并把链接添加到那封已经起草好的邮件里。虽然 Spark 花了几分钟才弄明白,但这个任务确实完成了;它创建了一份电子表格,然后回到邮件草稿中,把链接加了进去。

Woodward 上一次演示无疑是最令人印象深刻的。他对着 Spark 说,要它做几件事:把他与 CEO Sundar Pichai 的会议在日历上标成亮粉色,给一位新邻居写一封便条邀请他参加街区派对,并创建一份文档,帮助整理学年结束时孩子们的待办事项。对我自己的版本,我让它为我妻子的生日提前一个月创建一个日历事件,并把它标成亮粉色;起草一封邮件给我的家人,告诉他们发送最新一季《Taskmaster》的第一集;还创建一份文档,列出我和妻子在为我们的幼儿准备上学前班时需要了解的最重要事项。

我是在周五太平洋时间下午 3:35 发起这项请求的。在 I/O 大会上,Woodward 还特意演示了一下把手机放下,并承诺稍后在主题演讲中回来查看结果,他也确实这么做了。不过,在解决了一个小插曲之后——Spark 想要访问我的联系人,我拒绝了——我的任务大约四分钟后就完成了。

我再次对结果有点惊讶,不过它们并不完美:

* 我的 Google 日历现在已经在我妻子生日之前每个月的正确日期,添加了从上午 9 点到 10 点的事件。提醒的颜色是 Google 所称的“flamingo”,虽然这并不完全等于“hot pink”,但也差不多了。

* Spark 抓取了我直系家人的邮箱地址,并把它们放进了一封邮件草稿里。(奇怪的是,它没有包含我妻子的邮箱。)邮件正文准确写出了《Taskmaster》最新一季第一集的名字,但链接指向的是预告片,而不是真正的那一集。邮件里还包含了“loool”这个词,这是我在日常书面交流中会写的。

* Spark 在我的 Drive 里创建了一份 Google 文档,内容是一份上学前班准备清单。不过,这份文档目前只有我能访问;我问 Spark 是否可以把访问权限给我妻子,它说目前还做不到。

Spark 可能会是一个强大的工具。但我还是得提几点注意事项。和所有 AI 工具一样,你仍然需要检查它的输出,确保内容准确;当它调取个人信息来准备你要发给熟人的内容时,这种准确性的重要性可能会更高。尽管 Google 将 Spark 描述为一个可以独立运作的工具,但我发现自己一直在盯着它,或者检查它发到我手机上的通知。如果你必须对一个助手的每一个动作都严加看管,而不是信任它,那它还有什么用?而且,对于这种让我如此不放心的事情,为什么还要让一个资源消耗巨大的数据中心为相对无关紧要的任务耗电呢?

目前,Spark 仅向 Google AI Ultra 计划的订阅者开放,该计划起价为每月 99.99 美元,而且只面向美国用户,并且仅支持英语。Google 曾让我免费试用 Spark,而我认为它还不够好,不足以成为购买这些昂贵套餐的唯一理由。尤其是当我自己也能完成让 Spark 去做的所有任务时——只是会花更多时间而已。

如果你本身就深度使用 Google 生态系统,并且开启了 Personal Intelligence,Spark 的表现也会更好。我使用 Google 账号已经有大约二十年了,所以 Spark 可以调用大量数据来帮助生成答案。不过,虽然 Google 承诺在开启 Personal Intelligence 后,Gemini “不会直接”基于你的 Gmail 收件箱进行训练,但你仍然得信任 Google 会妥善保管你的数据。就目前而言,我不确定这是否值得这样的成本或风险。

来源与参考

  1. 原始链接
  2. Gemini’s new AI agent is about as good as Google’s demo

收录于 2026-06-02