XDOF向AI实验室出售机器人数据基础设施
TechCrunch AI··作者 Tim Fernholz
关键信息
XDOF表示,其业务不仅包括原始数据提供,还涵盖数据采集工具、清洗和标注,因为公司认为只做数据供给可能会陷入死胡同。它与加州大学伯克利分校AI研究实验室的合作产出了ABC,XDOF称其为迄今规模最大的高质量机器人训练数据集,包含13万条操作轨迹、300小时仿真数据和100小时评测数据。
资讯摘要
在这篇报道前两周,OpenAI表示将重启其机器人项目,这表明大型AI实验室又一次加快了让机器在物理世界中行动的步伐。TechCrunch指出,机器人训练面临的问题与大语言模型不同:机器人缺少现成的大规模训练数据。文本、YouTube视频以及众包拍摄的素材,往往分辨率不够高,也很难与真实物理交互一一对应。正因为如此,一类新的基础设施公司正在出现,它们专门提供数据采集、标注和数据管道服务。XDOF读作“ecks-doff”,它认为下一轮AI瓶颈不是模型或芯片,而是教会机器人理解并操作现实世界的数据反馈循环。该公司已经从Thrive Capital、Spark Capital、a16z、Lux和WndrCo融资7000万美元。
联合创始人兼CEO Philipp Wu表示,公司目前约有60名员工,已经在为20个客户服务,其中包括几家他不能公开点名的前沿AI实验室。Wu说,这个问题对他来说并不陌生:他在加州大学伯克利分校读博时,就曾因为缺少大规模数据而无法继续推进机器人基础模型研究。随后,他和联合创始人Fred Shentu一起做了GELLO,这是一种低成本遥操作系统,允许人类操作机械臂生成训练数据。XDOF于2024年10月由Wu、Shentu和首席运营官Nemo Jin共同创立,目标不是只卖数据,而是构建一个更完整的数据生态系统。公司还与加州大学伯克利分校AI研究实验室合作发布了ABC数据集,XDOF称其为迄今规模最大、质量最高的机器人训练数据集,包含13万条机械操作轨迹、300小时仿真和100小时评测。公司表示,这些数据已经被用于训练机器人完成折叠T恤、压平纸箱以及将AirPods放入充电盒等基准任务。

资讯正文
两周前,OpenAI 表示将重启其于 2021 年搁置的机器人项目——这是一个最新信号,表明最大的 AI 实验室正在竞相教机器在物理世界中运作。但打造有能力的机器人需要 AI 行业目前还不具备的东西,那就是与语言模型所用数据相匹配的训练数据。
这种缺口正在催生一种新型基础设施业务。与训练于海量公开文本上的 LLM 不同,机器人需要能够捕捉物理交互的数据,而这种数据几乎不存在。YouTube 视频以及由零工拍摄的影像都保真度较低,也很难与物理世界相对应。
XDOF(读作“ecks-doff”)今天低调亮相,该公司押注于 AI 领域下一个真正的瓶颈不是模型或芯片,而是教机器人如何与物理世界互动所需的数据反馈循环。
这家初创公司旨在构建前沿实验室和机器人公司自己很难独立搭建的数据管道、采集工具和标注系统,并已为此从 Thrive Capital、Spark Capital、a16z、Lux 和 WndrCo 筹集了 7000 万美元。联合创始人兼 CEO Philipp Wu 表示,XDOF 目前约有 60 名员工,已经在与 20 家客户合作,其中包括多家前沿 AI 实验室,但他不能透露具体名称。
Wu 说:“所有顶级实验室都在尝试推进机器人方向。我们已经见识过在大模型竞赛中稍微落后一点会带来的一些后果……你不想陷入这样一种局面:等你开始追逐这项技术时已经太晚了,而所有人都发现物理 AI 才是下一个前沿。”
Wu 自己还是加州大学伯克利分校博士生时,也遇到过这个问题。他当时的研究重点是让机器人从大规模数据集中学习技能。问题只有一个。
他告诉 TechCrunch:“我们没有可供使用的大规模数据。” “这就形成了一个鸡生蛋、蛋生鸡的问题——在我们甚至能够开始询问如何训练机器人基础模型之前,首先就需要真正去采集数据。”
Wu 和他未来的 XDOF 联合创始人兼 CTO Fred Shentu 共同参与了一个名为 GELLO 的项目,这是一个低成本遥操作系统,允许人类操作员控制机械臂来生成训练数据。Wu 说:“它最终成为机器人领域一篇非常有影响力的论文,因为很多人都有类似的需求和瓶颈,随后很多人开始利用这种设备来采集数据。”
看到了这一机会后,Wu、Shentu 以及第三位联合创始人兼首席运营官 Nemo Jin 于 2024 年 10 月创立了 XDOF,为那些推进机器人模型的公司提供数据生态系统。考虑到仅仅提供数据本身可能会变成一门走不远的生意,公司还专注于数据清洗、工具和标注——为机器人训练者创造一个自我强化的反馈循环。
作为起点,该公司正与 UC Berkeley 的 AI Research lab 合作,发布它所认为的有史以来规模最大的一套高质量机器人训练数据集,名为 ABC。该数据集包含 130,000 条机器人操作轨迹、300 小时的仿真数据,以及 100 小时的评测数据。这种规模化的预训练数据此前从未向学术界开放过。
“我们在语言、图像生成以及其他领域都看到过,当模型和数据被发布出来时,社区会取得一些你原本未必预料得到的成果,”协助组织此次发布的 Berkeley 博士生 David McAllister 告诉 TechCrunch。
团队已经利用这些数据在基准任务上训练机器人,例如叠 T 恤、压平纸箱,或者把 AirPods 装进充电盒里。
无限自由度
该公司计划围绕数据金字塔的三个层级展开工作。最有价值的一层,是在实际部署的机器人本体上收集的远程操控数据;下一层是由远程操控机器人收集更通用的数据,类似 GELLO 的做法;最后一层是由人类执行日常任务时采集的“第一视角”数据,XDOF 计划为此自行研发可穿戴传感器。
Wu 说:“你选择的摄像头会影响数据质量——而数据质量又会影响你的手部跟踪算法表现。如果一开始没有把硬件设计好,你收集到的数据可能会有一些你没有预料到的非常具体的问题。”
该公司计划在全球范围内雇佣并培训大批远程操作员和第一视角数据操作员——这是一种劳动密集型模式,也引出了一个显而易见的问题:为什么主要的实验室不自己做这些数据生产工作?
Wu 说:“你需要一个面积达数十万平方英尺的仓库,里面放着数百台机器人。你需要维护这些机器人,校准它们的物理参数,并对操作员进行恰当培训。”
这是一项需要专注、资金和运营规模扩张的建设工作,而大多数 AI 实验室更愿意外包出去——这正是 XDOF 押注的市场。
XDOF 这个名字是对机器人学术语“degrees of freedom(自由度)”的戏仿,这一术语描述的是机器人可以执行的独立运动数量。从肩膀到手腕,你的手臂有 7 个自由度。人形机器人公司 Figure AI 的最新机器人则有 30 个自由度。公司名称中的 X 承载着它的雄心:“任意自由度,无限自由度,”Wu 说。
来源与参考
收录于 2026-06-18