苹果据报用 Gemini 重塑 Siri
Ars Technica AI··作者 Ryan Whitwam
关键信息
报道称,苹果一直难以在基于 M 系列 Mac 芯片构建的 Private Cloud Compute 系统上直接运行谷歌的大型 Gemini 模型。苹果据说还在使用英伟达的 Confidential Computing 平台,以便在云端处理数据时保持用户数据加密。
资讯摘要
苹果自 2024 年首次承诺推出 AI 增强版 Siri 以来,已经多次推迟上线,而最新报道说,公司现在正转向谷歌,争取在今年晚些时候把这项能力落地。根据 The Information 的说法,苹果计划把 Siri 与 Gemini 结合起来,并采用一种本地与云端混合的架构。这个方向与苹果长期强调的隐私优先叙事不同,因为苹果过去一直更倾向于尽可能把 AI 处理放在本地设备上完成。文章指出,即便手机配有 Apple 的 Neural Engine 这类专用 AI 单元,受限于算力和内存,仍很难直接运行特别大的模型。它还提到,真正适合在手机上运行的模型通常更小,而且会经过量化处理,这会让速度更快,但也可能影响准确性和能力。
谷歌确实有面向移动端的 Gemini Nano,但这类模型主要用于像上下文功能和音频摘要这样的轻量任务,而不是完整的对话式助手。对于 Siri,苹果似乎是在对谷歌规模更大的云端 Gemini 模型做蒸馏,让小模型尽量模仿大模型的能力。即便如此,报道仍认为更复杂的请求最终还是需要走云端。The Information 还称,苹果一直难以让未蒸馏的 Gemini 模型在自己基于 M 系列 Mac 芯片的 Private Cloud Compute 基础设施上运行,因此更复杂的任务可能会转向谷歌云,同时借助英伟达的 Confidential Computing 在处理过程中保持数据加密。

资讯正文
如今,人与技术交互时几乎不可能完全避开生成式 AI,不过苹果在这方面的介入要少一些。当然,这并不完全是出于自愿。这家 iPhone 制造商自 2024 年首次承诺以来,已经多次推迟 AI 增强版 Siri,而与谷歌达成的一项协议将于今年晚些时候把这款标志性助手与 Gemini 合并。随着全球开发者大会(Worldwide Developers Conference)临近,苹果一直在努力把强大的 AI 智能带进智能手机这种算力相对有限的环境里。不过,苹果粉丝未必会喜欢最终结果。
苹果长期以来一直宣称在本地运行 AI 的隐私价值,但一份新报告显示,尽管苹果已尽最大努力,iPhone 的 Gemini 改造版仍将大量依赖云端的谷歌和英伟达。《The Information》报道称,融入 Gemini 的 Siri 将同时在设备端和云端运行,这显然与苹果偏好本地 AI、强调隐私的立场相悖。
每当有新的芯片发布,我们都会听到关于硅芯片如何针对 AI 进行了优化——苹果也会围绕 Neural Engine 的升级来强调这一点。你可能会从这些宏大的说法中以为,智能手机已经具备处理强大 AI 模型的能力,但事实未必如此。实际上,大多数手机中的 GPU 能处理的 AI token 数量甚至比面向 AI 的 NPU 还要多。像苹果 Neural Engine 这样的组件,设计初衷是进行具备上下文感知、且高效的 AI 处理。即便手机拥有更快的 AI 处理能力,它们也缺乏把庞大模型保存在内存中的 RAM。
即便是最大的 AI 模型,也仍然只是能力平平的助手,这使得本地 AI 变得极具挑战性。运行在手机上的 AI 模型体积更小,参数数量最多只有几十亿。相比之下,《The Information》报道称,谷歌最新的 Gemini 模型拥有数万亿参数。本地 AI 模型还会被“量化”以更低精度运行,这样虽然速度更快,但会影响 token 生成的准确性。所有这些因素叠加在一起,就造就了那种感觉上不如云端版本聪明的 AI,而即便是大型云端模型,有时也会相当笨。
令人惊叹、不断缩水的 Gemini
谷歌有针对移动设备优化的 Gemini 版本,称为 Gemini Nano。不过,这些版本是为 Magic Cue 和音频摘要这类具备上下文感知的功能提供支持的。另一方面,Siri 应该是一种对话式助手——你与它对话,它就执行操作。这是一种不同的体验,需要不同类型的模型。在 Android 上,谷歌甚至都不打算在本地完成这件事。与 Gemini 对话时,始终会直接进入云端。
在敲定与谷歌的交易后,苹果显然开始着手对谷歌庞大的云端 Gemini 模型进行蒸馏。蒸馏是一种让一个更小、资源占用更低的模型学习模仿一个更大、更昂贵模型的过程。如果有足够时间,这种方法可以可靠地迁移有用能力,同时剔除模型中不那么重要的权重。这或许能让 Siri 在某些任务上借助私有的本地计算完成,但云端组件看起来仍不可避免。
将用户的 AI 数据在云端处理,可能会给 Apple 带来问题。在 WWDC 上,该公司很可能会强调自己多年设计芯片的经验,以及这如何让其在 AI 领域占据有利位置。不过,《The Information》称,Apple 甚至一直难以让 Google 庞大的未蒸馏 Gemini 模型在其定制的 Private Cloud Compute 基础设施上运行,而该基础设施是建立在 M 系列 Mac 芯片之上的。
当更智能的 Siri 推出时,它很可能会把更复杂的任务转交给 Google 的云基础设施,而不是 Apple 自己的,但它不会运行在 Google 的 TPU 上。据报道,Apple 已与 Nvidia 签署协议,使用其 Confidential Computing 平台来实现这一目的。Confidential Computing 会在云端处理数据时,让数据在 Nvidia GPU 上保持加密状态,这或许能帮助 Apple 继续声称自己仍然高度重视用户隐私方面的顾虑。它甚至可能继续沿用自己的 Private Cloud Compute 品牌来命名这一系统。
iPhone 大概不会告诉你,是 Gemini 的哪个版本在处理某一项 Siri 请求。设计本地与云端 AI 相结合的混合系统的设备制造商,喜欢谈论如何让体验感觉“无缝”。不过,还是可能会有一些线索。
我们都熟悉大型 AI 模型的迟缓,它们在生成 token 时可能会长时间持续运算。Nvidia 的全加密 Confidential Compute 确实会比其他 AI 选项更慢一些。用户在 Siri 需要连接远程服务器时,可能会更明显地感受到这一点,但本地 AI 的能力毕竟有限,而最优秀的模型只能运行在价值数百万美元的服务器上。
来源与参考
收录于 2026-05-29