Google 的 AI 眼镜接近可用

TechCrunch AI··作者 Sarah Perez

关键信息

这款带显示的眼镜是晚于纯音频型号的下一阶段产品,并由 Warby Parker、Gentle Monster 和 Samsung 共同参与开发。演示原型并不是最终量产设计:它缺少部分感知功能,Google 表示正式版本应能检测眼镜是否被戴上或取下,并允许用户选择在启动 Gemini 时是否同时开启摄像头。

资讯摘要

在 Google I/O 上,TechCrunch 短暂上手体验了 Google 即将推出的 AI 眼镜,这款产品同时具备音频功能和镜片内显示。该 Android XR 眼镜最早在去年的活动上公布,目标是在佩戴者视野中直接叠加有用信息,把内容覆盖到真实世界之上。Google 表示,它可以显示天气、步行导航、Uber 接送信息、实时翻译,以及用户甚至可以用 AI 设计出来的小组件。公司还提到,这些眼镜将兼容 iOS 和 Android 手机,而且音频版和未来的显示版都能使用。带显示的型号被定位为第一代纯音频眼镜之后的下一步,而纯音频眼镜据称会在今年秋季开始发货。Google 正与 Warby Parker、Gentle Monster 和 Samsung 合作开发这款眼镜,把自家的技术与这些品牌的镜框设计风格结合起来。TechCrunch 试用的原型机已经足够精致,能够开放给外部测试,但它仍然明显不是最终量产版本,因为 Google 希望借此更自由地测试显示硬件以及电池续航之间的取舍。演示版也缺少一些量产功能,例如检测眼镜是否被戴上或取下。

激活 Gemini 需要按住镜腿右侧两秒,设备会发出启动提示音,在原型机上这一操作还会同时启动摄像头。首次测试中,眼镜可以播放音乐,但由于现场非常嘈杂,难以准确判断音质,这也说明它并不适合替代高品质耳机,不过在户外散步、徒步或做家务时听歌是够用的。第二次测试中,记者按下拍照键拍摄了一张人物照片,显示屏是关闭状态,照片随后被传到手机和手表上。Google 还表示,之后可以通过长按来录制视频,但该功能在原型机上尚未开放测试。用户也可以直接让 Gemini 拍照并进行 AI 处理,比如把照片里的人“变成动漫角色”;图片会先发送到手机,再传到 Gemini 和 Nano Banana 服务器,最后返回编辑后的版本。在 Google I/O 现场,由于 Wi-Fi 负载很高,这一往返过程大约花了 45 秒。开启显示后,眼镜会出现一个简单的主页界面,说明这款产品虽然仍处在原型阶段,但已经非常接近可实际使用的形态。

Google 的 AI 眼镜接近可用

资讯正文

在本周的 Google I/O 开发者大会上,我们有机会短暂上手了 Google 即将推出的 AI 智能眼镜——不是该公司表示将于今年秋季开始发货的纯音频眼镜,而是提供音频与视觉结合体验的那一款。

这款 Android XR 眼镜最早是在去年的活动上公布的,它配备了镜片内显示屏,能把有用信息显示在你的视野前方,并叠加在现实世界之上。其中包括可显示天气、步行导航、Uber 接单详情、实时翻译等内容的小组件,甚至还可以显示你自己用 AI 设计的小组件。

该公司还提到,这款眼镜将与 iOS 和 Android 手机配对使用,无论是纯音频版本,还是未来带显示屏的版本都可以。

带显示屏的这款眼镜,定位是作为今年晚些时候推出的第一代音频眼镜之后的下一步。该眼镜由 Warby Parker、Gentle Monster 和 Samsung 共同参与开发,将 Google 的技术与这些品牌的设计美学结合在一起。

与此同时,我们试用的这副眼镜仍然很大程度上只是原型机,不过已经精致到可以对外测试。演示这款 XR 眼镜的工作人员解释说,这个原型让 Google 不必过多顾虑不同风格和形状所涉及的一些外观细节,而是可以更自由地专注于试验显示技术及其对电池续航的影响。这意味着,就贴合度、形状、尺寸和细节打磨而言,这副眼镜与未来任何正式上市的版本都会非常不同。更准确地说,它更像是在一个基础且舒适的镜架中,先去试验眼镜的“内在”。

正式上市版本的眼镜将能够检测眼镜何时戴到头上、何时被取下,但我们试用的这副没有这项功能。

要激活 Gemini,只需按住眼镜框右侧两秒钟。随后会响起启动提示音,告诉你 Gemini 已经开启并正在监听。在演示版本中,启动 Gemini 的同时也会启动摄像头,但正式上市版本将允许用户自行设置是否在 Gemini 启动时一并打开摄像头。

在最初的一次测试中,我们让 Gemini 播放一位喜欢的艺人的歌曲,从而通过眼镜播放音乐。遗憾的是,场地太嘈杂,无法评估音质,因为音乐已经调到最大音量,但听起来仍然相对难以清晰、细致地听见。不过,从这次有限体验得到的初步印象来看,这副眼镜并不会成为高品质耳机的理想替代品;但如果你只是想在外出散步、徒步,或在家做家务时听点音乐,它还是够用的。不戴耳塞的好处是,你更容易听到别人说话,这一点相较于 Apple AirPods 等设备上的通透模式体验更有优势。

要关闭音乐,只需像敲太阳穴一样,在镜框侧面中间位置轻点一下即可。

在第二次测试中,我们按下拍照按钮拍下了一张人物照片。显示屏是关闭的,所以照片被传到了我们的手机和手表上。(之后你将可以长按来拍摄视频,但这个选项在原型机上还无法测试。对于视频,你会看到一个视频缩略图预览,而不是照片。)

你也可以直接让 Gemini 拍照,而不必按下拍照按钮,然后对结果进行某种 AI 处理。比如,你可以说:“拍张照片,把这个人变成动漫角色。”照片会先发送到手机,然后送到 Gemini 和 Nano Banana 服务器,之后再以编辑后的版本返回。

在 Google I/O 现场,由于 Wi-Fi 负载很重,这个往返过程大约花了 45 秒。

在开启显示屏的情况下,你会在视野中看到一个简单的主屏幕。演示版预装了一些小组件,显示天气和 Google I/O 活动的倒计时。如果这些是你使用眼镜的主要场景,你还可以为特定应用构建快速启动入口,比如 Google Maps 或 Translate。

这款原型机只在右眼上方配有一个显示屏,但该平台既支持单屏,也支持双屏,还支持纯音频眼镜。画面本身有点模糊,不过我们把这归因于我们的度数隐形眼镜——一边戴的是优化远视的镜片,另一边戴的是优化近视的镜片。当我们闭上一只眼时,画面变得更清晰,但这种体验几乎立刻让我们右眼上方出现了些许眼疲劳,目前还不清楚是否完全是度数镜片导致的。

最出色的演示之一是眼镜上的语言翻译体验,它由手机上的 Google Translate 应用提供支持。一位演示者快速说着西班牙语,眼镜会自动识别语言,并在显示屏上显示英文文本,同时 Gemini 也会在我们的耳边说英语。我们能看出,世界各地的旅行者只为了这个功能就会买这副眼镜。

我们需要说明的是,Translate 也可以在纯音频眼镜上使用,只是不会把文字显示在眼镜上。相反,如果需要,你可以在手机上看到转录内容,同时还会收到实时音频反馈。

另一个演示是使用眼镜进行导航。显然,我们没法出去走一圈、离开会场来测试它的准确性,但我们可以大致了解它的工作方式。你可以通过让 Gemini 带你前往某个目的地来启动 Google Maps 体验——这个目的地甚至可以像“最近的咖啡店”这样模糊。

Gemini 会在手机上启动 Google Maps,体验加载时会有短暂延迟,随后眼镜会显示逐向导航。当你向前看时,下一次转向的信息会显示出来。但如果你需要在空间中重新确认方位,就低头看地面,就能看到地图上的蓝点。你也可以向左和向右转动,在空间中进行旋转,就像你试图在手机上把蓝点转到正确方向时那样。

然后,当你再次抬头时,就可以继续走路,而地图也不会挡住你的视线。

由于这套体验与手机上的 Google Maps 绑定,像“home”和“work”这类已保存的目的地也会直接可用。

我们还短暂试用了这副眼镜,用它识别视野中的各种物体并向它们提问。眼镜最初在识别我们面前架子上一个莫奈画作的复制品时遇到困难,但这是因为这款原型机没有自动开启摄像头——必须先在应用里重新打开。即便如此,在我们走近、把注意力集中到左下角的莫奈签名上之后,Gemini 也问了好几个问题才说它看起来像一幅莫奈作品。

其他测试则顺利得多,眼镜立刻识别出了架子上的植物,并回答了关于书中不同食谱的问题。不过,这些功能如今你也可以通过 Google Lens(或集成在聊天机器人应用中的其他 AI 模型)实现,只是不用把手机掏出来就能做到,想想还是挺有意思的。

Google 表示,随着其可信测试者计划扩大,公司将在今年晚些时候分享更多关于 Android XR 显示眼镜的信息。

在此期间,公司认为音频版本已经足以满足部分用户的需求;这或许也是在当前尚未准备好推出显示眼镜、而 Meta 和 Snap 又在这一领域形成竞争压力的情况下,一种比较聪明的说法。

与显示版一样,这款音频眼镜也可使用 Google 的 Gemini AI,并可通过眼镜镜架内的扬声器私密听到。你可以通过眼镜听音乐、按下按钮拍照、拨打电话,或者像未来的显示版本那样,从这些眼镜上调用手机应用。

在我们演示的项目中,并没有包括调用其他第三方应用,但这款眼镜将允许用户让 Gemini 执行诸如“把这份食谱里的食材添加到我的购物清单”之类的操作。

在活动主题演讲中,Google 展示的另一个例子里,这副眼镜可以看到佩戴者正在炉灶上烹调的一顿饭,并就这顿饭提供反馈,比如肉是否已经完全熟透。

来源与参考

  1. 原始链接
  2. We tried Google’s AI glasses and they’re almost there | TechCrunch

收录于 2026-05-23