Google将Genie与街景结合生成真实地点AI世界
The Decoder··作者 Maximilian Schreiner
关键信息
用户可以在地图上放置图钉,选择“Ocean World”“Desert Sands”“Stone Age”或“B&W film”等可选风格,并描述一个角色来生成可行走的世界。Google 表示该系统使用“Maps Imagery Grounding”,但演示仍能看到明显的粗糙之处,例如纹理发软、几何结构不稳定以及过渡效果超现实。
资讯摘要
Google DeepMind 正在把 Genie 世界模型与 Street View 图像结合起来,创建从真实世界地点出发的可交互 AI 生成环境。用户可以在地图上选择一个位置,额外选择一种风格,并输入角色描述,然后 Genie 3 会生成一个与 Street View 画面绑定的可行走世界。Google 表示,这一能力依赖于“Maps Imagery Grounding”,这也是开发者已经用来基于 Street View 数据制作 AI 视觉内容的接口。公司展示了多个示例,例如被洪水淹没的金门大桥,以及以 1920 年代风格呈现的德州沃斯堡牲畜交易区。报道强调,Google 巨大的 Street View 数据库是它的核心优势,因为它既能作为训练材料,也能作为生成世界的锚点。
DeepMind 并不主要把 Genie 当作面向消费者的产品,而是把它视为 AI 代理和机器人用于导航、推理与学习的训练环境。DeepMind 的 SIMA 2 已经把 Genie 用作训练场,而 Waymo 也用它来模拟自动驾驶所需的真实街道场景。前 Google 产品经理 Bilawal Sidhu 发布的早期测试展示了很大的表现范围,包括驾驶 Google Maps 主题的 F1 赛车穿过拉斯维加斯大道、以松鼠骑滑板车的身份移动、驾驶小船穿越奥斯汀的 Lady Bird Lake,以及利用室内 Street View 数据步行穿过白宫。这些演示也暴露了当前的局限性,例如纹理柔和、几何结构不稳定和场景过渡超现实。Google 正在向 Google AI Ultra 订阅用户全球开放该功能,但真实地点功能目前只支持美国地点,DeepMind 也明确表示这仍是一个实验性的研究原型。

资讯正文
Google 将其 Genie 世界模型与 Street View 结合,创建基于真实地点、可探索的 AI 世界
Google Deepmind 将其 Genie 世界模型与 Street View 图像连接起来,让用户生成交互式、由 AI 构建的环境,这些环境以真实地点为起点。
用户在地图上放置一个图钉,选择一个可选风格,比如“Ocean World”“Desert Sands”“Stone Age”或“B&W film”,然后描述一个角色。随后,Genie 3 会构建一个可步行穿行的世界,其起始点与真实的 Street View 影像相绑定。Google 表示,这项功能依赖于“Maps Imagery Grounding”,这是开发者已经用来根据 Street View 数据创建 AI 驱动视觉内容的一个接口。
该公司还展示了这项技术的演示,例如被洪水淹没的金门大桥,以及按 20 世纪 20 年代风格打造的德克萨斯州沃思堡牲畜市场(Fort Worth Stockyards)。
Google 的地图数据让它拥有其他竞争对手无法匹敌的优势
真正的故事在于数据。多年来,Google 一直在收集道路、建筑内部、水道以及偏远地区的 Street View 图像。如今,这个图库既充当训练素材,也成为生成式世界的锚点。
不过,Google 并不是主要把 Genie 作为一款面向消费者的产品来推销。这个世界模型的目的,是为 AI 代理和机器人提供一个可以导航、推理和学习的环境。Deepmind 的代理 SIMA 2 已经把 Genie 用作训练场。与此同时,Waymo 也用它来模拟适合自动驾驶汽车的真实街道场景。与 Street View 的连接意味着,这些训练运行现在可以锚定到特定的现实世界地点。
早期演示看起来像是技术展示与游戏预览的结合
曾担任 Google AR/VR 和 3D Maps 产品经理的 Bilawal Sidhu 发布了一串测试提示,展示了这项功能在实际中的样子。他驾驶一辆带有 Google Maps 标识的一级方程式赛车沿着拉斯维加斯大道狂飙,骑着滑板车以松鼠的身份经过艺术宫(Palace of Fine Arts),驾驶一艘船穿越奥斯汀的 Lady Bird Lake,还借助室内 Street View 数据走进了白宫。
Woot! You can now simulate real world places by grounding Genie 3 experiences with Street View imagery.
Google sitting on the mother lode of real world data, and is starting to put it to work!
Let's dive into some prompts & locations I tested... pic.twitter.com/TlXSWNx08h
- Bilawal Sidhu (@bilawalsidhu) May 19, 2026
这些示例展示了功能的广度,但也暴露出仍然可见的粗糙边缘:纹理较柔、几何结构不稳定,以及带有超现实感的过渡。
谁能获得访问权限,以及目前还缺少什么
将带有 Street View 锚定功能的 Project Genie 正在面向全球的 Google AI Ultra 订阅用户推出,该服务每月收费 200 美元,适用于 18 岁及以上人群。目前,真实世界地点功能仅在美国地点可用,但后续计划扩展。
DeepMind 本身将其称为一项实验性研究原型,并表示团队正在开发一个更好的版本。
来源与参考
收录于 2026-05-21