Google 的 AI 眼镜接近可用

TechCrunch AI·5月22日 23:37 UTC·作者 Sarah Perez

关键信息

这款带显示的眼镜是晚于纯音频型号的下一阶段产品，并由 Warby Parker、Gentle Monster 和 Samsung 共同参与开发。演示原型并不是最终量产设计：它缺少部分感知功能，Google 表示正式版本应能检测眼镜是否被戴上或取下，并允许用户选择在启动 Gemini 时是否同时开启摄像头。

资讯摘要

在 Google I/O 上，TechCrunch 短暂上手体验了 Google 即将推出的 AI 眼镜，这款产品同时具备音频功能和镜片内显示。该 Android XR 眼镜最早在去年的活动上公布，目标是在佩戴者视野中直接叠加有用信息，把内容覆盖到真实世界之上。Google 表示，它可以显示天气、步行导航、Uber 接送信息、实时翻译，以及用户甚至可以用 AI 设计出来的小组件。公司还提到，这些眼镜将兼容 iOS 和 Android 手机，而且音频版和未来的显示版都能使用。带显示的型号被定位为第一代纯音频眼镜之后的下一步，而纯音频眼镜据称会在今年秋季开始发货。Google 正与 Warby Parker、Gentle Monster 和 Samsung 合作开发这款眼镜，把自家的技术与这些品牌的镜框设计风格结合起来。TechCrunch 试用的原型机已经足够精致，能够开放给外部测试，但它仍然明显不是最终量产版本，因为 Google 希望借此更自由地测试显示硬件以及电池续航之间的取舍。演示版也缺少一些量产功能，例如检测眼镜是否被戴上或取下。

激活 Gemini 需要按住镜腿右侧两秒，设备会发出启动提示音，在原型机上这一操作还会同时启动摄像头。首次测试中，眼镜可以播放音乐，但由于现场非常嘈杂，难以准确判断音质，这也说明它并不适合替代高品质耳机，不过在户外散步、徒步或做家务时听歌是够用的。第二次测试中，记者按下拍照键拍摄了一张人物照片，显示屏是关闭状态，照片随后被传到手机和手表上。Google 还表示，之后可以通过长按来录制视频，但该功能在原型机上尚未开放测试。用户也可以直接让 Gemini 拍照并进行 AI 处理，比如把照片里的人“变成动漫角色”；图片会先发送到手机，再传到 Gemini 和 Nano Banana 服务器，最后返回编辑后的版本。在 Google I/O 现场，由于 Wi-Fi 负载很高，这一往返过程大约花了 45 秒。开启显示后，眼镜会出现一个简单的主页界面，说明这款产品虽然仍处在原型阶段，但已经非常接近可实际使用的形态。

资讯正文

在本周的 Google I/O 开发者大会上，我们有机会短暂上手了 Google 即将推出的 AI 智能眼镜——不是该公司表示将于今年秋季开始发货的纯音频眼镜，而是提供音频与视觉结合体验的那一款。

这款 Android XR 眼镜最早是在去年的活动上公布的，它配备了镜片内显示屏，能把有用信息显示在你的视野前方，并叠加在现实世界之上。其中包括可显示天气、步行导航、Uber 接单详情、实时翻译等内容的小组件，甚至还可以显示你自己用 AI 设计的小组件。

该公司还提到，这款眼镜将与 iOS 和 Android 手机配对使用，无论是纯音频版本，还是未来带显示屏的版本都可以。

带显示屏的这款眼镜，定位是作为今年晚些时候推出的第一代音频眼镜之后的下一步。该眼镜由 Warby Parker、Gentle Monster 和 Samsung 共同参与开发，将 Google 的技术与这些品牌的设计美学结合在一起。

与此同时，我们试用的这副眼镜仍然很大程度上只是原型机，不过已经精致到可以对外测试。演示这款 XR 眼镜的工作人员解释说，这个原型让 Google 不必过多顾虑不同风格和形状所涉及的一些外观细节，而是可以更自由地专注于试验显示技术及其对电池续航的影响。这意味着，就贴合度、形状、尺寸和细节打磨而言，这副眼镜与未来任何正式上市的版本都会非常不同。更准确地说，它更像是在一个基础且舒适的镜架中，先去试验眼镜的“内在”。

正式上市版本的眼镜将能够检测眼镜何时戴到头上、何时被取下，但我们试用的这副没有这项功能。

要激活 Gemini，只需按住眼镜框右侧两秒钟。随后会响起启动提示音，告诉你 Gemini 已经开启并正在监听。在演示版本中，启动 Gemini 的同时也会启动摄像头，但正式上市版本将允许用户自行设置是否在 Gemini 启动时一并打开摄像头。

在最初的一次测试中，我们让 Gemini 播放一位喜欢的艺人的歌曲，从而通过眼镜播放音乐。遗憾的是，场地太嘈杂，无法评估音质，因为音乐已经调到最大音量，但听起来仍然相对难以清晰、细致地听见。不过，从这次有限体验得到的初步印象来看，这副眼镜并不会成为高品质耳机的理想替代品；但如果你只是想在外出散步、徒步，或在家做家务时听点音乐，它还是够用的。不戴耳塞的好处是，你更容易听到别人说话，这一点相较于 Apple AirPods 等设备上的通透模式体验更有优势。

要关闭音乐，只需像敲太阳穴一样，在镜框侧面中间位置轻点一下即可。

在第二次测试中，我们按下拍照按钮拍下了一张人物照片。显示屏是关闭的，所以照片被传到了我们的手机和手表上。（之后你将可以长按来拍摄视频，但这个选项在原型机上还无法测试。对于视频，你会看到一个视频缩略图预览，而不是照片。）

你也可以直接让 Gemini 拍照，而不必按下拍照按钮，然后对结果进行某种 AI 处理。比如，你可以说：“拍张照片，把这个人变成动漫角色。”照片会先发送到手机，然后送到 Gemini 和 Nano Banana 服务器，之后再以编辑后的版本返回。

在 Google I/O 现场，由于 Wi-Fi 负载很重，这个往返过程大约花了 45 秒。

在开启显示屏的情况下，你会在视野中看到一个简单的主屏幕。演示版预装了一些小组件，显示天气和 Google I/O 活动的倒计时。如果这些是你使用眼镜的主要场景，你还可以为特定应用构建快速启动入口，比如 Google Maps 或 Translate。

这款原型机只在右眼上方配有一个显示屏，但该平台既支持单屏，也支持双屏，还支持纯音频眼镜。画面本身有点模糊，不过我们把这归因于我们的度数隐形眼镜——一边戴的是优化远视的镜片，另一边戴的是优化近视的镜片。当我们闭上一只眼时，画面变得更清晰，但这种体验几乎立刻让我们右眼上方出现了些许眼疲劳，目前还不清楚是否完全是度数镜片导致的。

最出色的演示之一是眼镜上的语言翻译体验，它由手机上的 Google Translate 应用提供支持。一位演示者快速说着西班牙语，眼镜会自动识别语言，并在显示屏上显示英文文本，同时 Gemini 也会在我们的耳边说英语。我们能看出，世界各地的旅行者只为了这个功能就会买这副眼镜。

我们需要说明的是，Translate 也可以在纯音频眼镜上使用，只是不会把文字显示在眼镜上。相反，如果需要，你可以在手机上看到转录内容，同时还会收到实时音频反馈。

另一个演示是使用眼镜进行导航。显然，我们没法出去走一圈、离开会场来测试它的准确性，但我们可以大致了解它的工作方式。你可以通过让 Gemini 带你前往某个目的地来启动 Google Maps 体验——这个目的地甚至可以像“最近的咖啡店”这样模糊。

Gemini 会在手机上启动 Google Maps，体验加载时会有短暂延迟，随后眼镜会显示逐向导航。当你向前看时，下一次转向的信息会显示出来。但如果你需要在空间中重新确认方位，就低头看地面，就能看到地图上的蓝点。你也可以向左和向右转动，在空间中进行旋转，就像你试图在手机上把蓝点转到正确方向时那样。

然后，当你再次抬头时，就可以继续走路，而地图也不会挡住你的视线。

由于这套体验与手机上的 Google Maps 绑定，像“home”和“work”这类已保存的目的地也会直接可用。

我们还短暂试用了这副眼镜，用它识别视野中的各种物体并向它们提问。眼镜最初在识别我们面前架子上一个莫奈画作的复制品时遇到困难，但这是因为这款原型机没有自动开启摄像头——必须先在应用里重新打开。即便如此，在我们走近、把注意力集中到左下角的莫奈签名上之后，Gemini 也问了好几个问题才说它看起来像一幅莫奈作品。

其他测试则顺利得多，眼镜立刻识别出了架子上的植物，并回答了关于书中不同食谱的问题。不过，这些功能如今你也可以通过 Google Lens（或集成在聊天机器人应用中的其他 AI 模型）实现，只是不用把手机掏出来就能做到，想想还是挺有意思的。

Google 表示，随着其可信测试者计划扩大，公司将在今年晚些时候分享更多关于 Android XR 显示眼镜的信息。

在此期间，公司认为音频版本已经足以满足部分用户的需求；这或许也是在当前尚未准备好推出显示眼镜、而 Meta 和 Snap 又在这一领域形成竞争压力的情况下，一种比较聪明的说法。

与显示版一样，这款音频眼镜也可使用 Google 的 Gemini AI，并可通过眼镜镜架内的扬声器私密听到。你可以通过眼镜听音乐、按下按钮拍照、拨打电话，或者像未来的显示版本那样，从这些眼镜上调用手机应用。

在我们演示的项目中，并没有包括调用其他第三方应用，但这款眼镜将允许用户让 Gemini 执行诸如“把这份食谱里的食材添加到我的购物清单”之类的操作。

在活动主题演讲中，Google 展示的另一个例子里，这副眼镜可以看到佩戴者正在炉灶上烹调的一顿饭，并就这顿饭提供反馈，比如肉是否已经完全熟透。

来源与参考

收录于 2026-05-23