Physical Intelligence 的 π0.7 机器人展现类大模型泛化能力
The Decoder··作者 Maximilian Schreiner
关键信息
该模型结合了谷歌的 Gemma3(40亿参数)与一个8.6亿参数的动作专家;训练包含丰富的上下文信息,如子任务指令、性能元数据以及运行时生成的子目标图像。
资讯摘要
Physical Intelligence 的 π0.7 机器人模型通过组合来自多样化训练数据的技能展示了组合泛化能力,包括自然语言指令、实验元数据和运行时生成的子目标图像。它在新机器人平台上实现了与人类远程操作员相当的零样本迁移性能。例如,在逐步语言指导下,它成功将红薯放入空气炸锅,尽管此前没有针对此任务的直接训练数据。
该模型利用轻量级世界模型在执行过程中生成子目标图像。研究人员承认可能存在数据污染问题,但他们认为技能重组——无论来源如何——才是真正泛化的关键。这种方法使单一模型在洗衣折叠和制作浓缩咖啡等任务上达到多个专用模型的性能。

资讯正文
Physical Intelligence展示了具备类似大语言模型泛化能力的机器人模型,包括其缺陷
美国初创公司Physical Intelligence推出了π0.7,这是一种新的机器人基础模型,旨在重新组合训练期间学到的技能,类似于语言模型从训练数据中重新组装文本片段的方式。研究人员称这标志着机器人领域‘组合泛化’的早期迹象。
该模型基于谷歌开源的Gemma3语言模型(含40亿参数),并搭配一个较小的8.6亿参数动作专家模块,用于生成实际的机器人动作。然而,PI表示,决定性因素并非架构本身,而是训练方法。
以往的机器人模型在训练时通常只获得简短的任务描述,例如“折叠T恤”。而π0.7还获得了多种上下文信息:自然语言形式的子任务指令、演示质量与速度的剧集元数据、控制模式标签,甚至显示中间步骤结果应呈现样子的子目标图像——这些子目标图像由另一个轻量级世界模型在运行时生成。
这种方法使得可以使用不同质量的数据进行训练。失败尝试或缓慢演示只需标记相应元数据即可,无需丢弃。
一个通用模型胜过多个专用模型
PI报告称,单一的π0.7模型在洗衣折叠、意式咖啡制作和盒子搭建等任务上的表现,可媲美此前经过强化学习微调的π*0.6专用模型。跨机器人平台迁移也有效:一台双臂UR5e工业机械臂在未收集任何折叠数据的情况下,仍以80%的成功率折叠T恤。据PI称,这一成绩相当于经验丰富的操作员首次尝试用该机器人执行此任务时的零样本性能。
新任务还可通过语言指导来教授。人类通过逐个给出指令引导机器人完成活动,这些指导过程随后可用于训练高层策略,使机器人能自主执行任务,而无需采集传统远程操控数据。
空气炸锅与组合泛化的疑问
作为组合能力的典型案例,PI提到将红薯放入空气炸锅的任务。没有指导时模型失败,但在逐步指导下成功实现。技术报告中团队写道,在训练数据中仅发现两个机器人关闭空气炸锅的片段,加上来自开源DROID数据集的Franka机械臂相关数据。
仔细观看配套演示视频后发现,DROID数据集中Franka机械臂打开空气炸锅抽屉并将瓶子放进去。从结构上看,这与π0.7声称通过重组已知技能解决的红薯任务非常接近。PI称这些片段与移动机器人实验中的行为‘相当不同’,并将结果解释为模型重新组合技能的证据,就像语言模型从网络中重新组合文本片段一样。
来自DROID数据集的视频。
物理智能展示了具备类似大型语言模型泛化能力的机器人模型,包括其缺陷
这一问题在机器人领域引发了与语言模型世界类似的争论:一个模型究竟是通过真正的泛化来解决新任务,还是本质上只是回忆了非常相似的训练数据?在语言模型中,这个问题多年来一直被称为数据污染,即评估任务在训练材料中以相同或非常相似的形式出现。
物理智能(PI)在其报告中承认,鉴于数据集的巨大规模和多样性,几乎无法确定哪些任务真正是全新的。然而,该团队认为,这种已知构建模块的重新组合正是“组合泛化”的本质。他们表示,在实践中,无论技能是源于泛化还是从类似情境中迁移而来(他们称之为‘混搭’),都没有区别。
语言模型现象延伸至机器人领域
π0.7表明,机器人基础模型已经达到了一个规模,在这个规模下,类似于大型语言模型的现象开始显现:提示(prompt)的性质变得至关重要,性能高度依赖于提供的上下文,区分‘真正’的泛化、混搭和检索相似示例成为核心评估难题。
报告中的额外消融实验也显示了元数据在扩展过程中的重要性。如果没有高质量的标注,随着更多但质量较低的数据加入,模型性能会下降;而有了元数据,即使平均质量下降,模型仍能从额外数据中持续受益。
报告并未涉及推理模型的话题。PI仅在结尾处暗示,像π0.7这样的可引导模型未来可能通过‘提前思考’可能的方法来解决更复杂的任务。当前模型尚未能自主迈出这一步。
AI新闻无炒作——由人类精选
来源与参考
收录于 2026-04-18