零工在家中训练人形机器人

MIT Technology Review AI··作者 Michelle Kim

关键信息

像尼日利亚的Zeus这样的工人每小时赚15美元——在当地属于高收入——但觉得重复任务很无聊。收集的数据包括精确的动作,对训练机器人准确执行现实任务至关重要。

资讯摘要

人形机器人需要真实的物理交互技能,这是虚拟仿真无法完全复制的。为了弥补这一差距,像Micro1这样的公司雇佣全球零工录制自己进行日常家务(如熨衣服或洗碗)的过程。这些视频为训练机器人在家庭和工厂中操作提供了关键的动作数据。

尼日利亚、印度和阿根廷等地的工人参与其中,因为这份工作收入高于当地其他选择。然而,这项工作可能枯燥,并引发关于知情同意和隐私的伦理问题。尽管存在挑战,对真实世界机器人训练数据的需求正在激增,相关企业每年投入超过一亿美元用于此类数据采购。

零工在家中训练人形机器人

资讯正文

当住在尼日利亚中部山城的医学生 Zeus 从医院漫长的一天回来后,他会打开环形灯,把 iPhone 固定在额头,开始录制自己。他像梦游者一样举起双手,把床单铺在床上,动作缓慢而谨慎,以确保自己的手始终在摄像头范围内。

Zeus 是一家总部位于加利福尼亚州帕洛阿尔托的美国公司 Micro1 的数据记录员,这家公司收集真实世界的视频数据并出售给机器人公司。随着特斯拉、Figure AI 和 Agility Robotics 等公司竞相打造类人机器人——这些机器人旨在工厂和家庭中模仿人类外形和动作——像 Zeus 这样的零工所拍摄的视频正成为训练这类机器人的最新热门方式。

Micro1 已经在全球超过 50 个国家雇佣了数千名合同工,包括印度、尼日利亚和阿根廷等地,那里有大量熟悉技术的年轻人正在寻找工作机会。他们把 iPhone 固定在头上,录下自己叠衣服、洗碗和做饭的过程。这份工作在当地收入水平来看相当可观,也推动了当地经济发展,但同时也引发了关于隐私和知情同意的棘手问题。而且这项工作有时颇具挑战性,甚至令人感到古怪。

Zeus 是在 11 月偶然发现这份工作的,当时 LinkedIn 和 YouTube 上到处都在讨论它。「这会是一个绝佳的机会,能留下一些数据,用于未来训练机器人,」他这样想。

Zeus 每小时能赚 15 美元,在失业率高企、经济紧张的尼日利亚属于不错的收入。但作为一名充满热情的学生,梦想成为一名医生的他,每天花数小时熨烫衣物让他感到枯燥乏味。

「我真的不太喜欢这个,」他说,「我这种人需要一份……需要动脑的技术类工作。」

Zeus 及所有接受《麻省理工科技评论》采访的工人均要求使用化名,因为他们并未被授权谈论自己的工作。

类人机器人之所以难造,是因为操控物理对象是一项难以掌握的技能。但近年来,支撑聊天机器人如 ChatGPT 的大型语言模型兴起,促使机器人领域发生范式转变。正如大型语言模型通过学习互联网上海量文本数据来生成文字一样,许多研究人员相信,类人机器人也可以通过大量运动数据的训练来学会与世界互动。

编辑注:在最近的一项读者投票中,《麻省理工科技评论》读者将类人机器人选为 2026 年十大突破技术中的第 11 项。

然而,机器人学所需的物理世界数据远比语言模型复杂得多,而这样的数据很难获取。虚拟仿真可以训练机器人完成杂技动作,却无法教会它们如何抓握或移动物体,因为仿真难以精确模拟物理规律。为了让机器人真正适用于工厂或担任家务助理,我们可能仍需要耗时且昂贵的真实世界数据。

那些在家训练人形机器人的零工

投资者正疯狂地投入资金解决这一挑战,仅在2025年就已花费超过60亿美元用于人形机器人研发。与此同时,在家录制数据正成为全球蓬勃发展的零工经济。像Scale AI和Encord这样的数据公司正在招募自己的数据记录员队伍,而DoorDash则支付配送司机拍摄自己做家务的视频。在中国,数十个国有机器人训练中心的工人佩戴虚拟现实头显和外骨骼设备,教人形机器人如何打开微波炉或擦拭桌面。

Micro1首席执行官阿里·安萨里(Ali Ansari)表示:“需求量很大,并且增长非常迅速。”他估计,如今每家机器人公司每年花在购买他公司及其他类似公司提供的真实世界数据上的费用已经超过1亿美元。

一天的生活

Micro1的工人由一名名为Zara的AI代理进行筛选,该代理会进行面试并审查家务视频样本。每周,他们都会提交自己在家完成家务的视频,需遵循一系列指令,比如保持双手可见、动作自然。这些视频会由AI和人工共同审核,决定是否通过。随后,它们会被AI标注,并由数百名人类团队成员对画面中的动作进行分类标记。

由于这种机器人训练方法尚处于起步阶段,目前还不清楚什么样的数据才算优质训练数据。但安萨里表示:“你需要提供大量多样化的数据,才能让机器人更好地掌握基本导航和环境操作能力。”

不过许多工人反映,在狭小的家中创作多样化‘家务内容’是一项挑战。一位名叫泽乌斯(Zeus)的年轻学生住在一间简陋的单间公寓里,每天只能拍到熨衣服的视频。印度德里的一位家教阿琼(Arjun)则要花一个小时才能制作一段15分钟的视频,因为他花太多时间构思新的家务任务。

“在家里能拍多少内容?到底能拍多少?”他说道。

隐私问题也令人困扰。Micro1要求工人不要露脸,也不要暴露姓名、电话号码或出生日期等个人信息。然后,公司会使用AI和人工审核人员清除任何遗漏的内容。

即便没有脸部画面,这些视频仍捕捉到了工人生活的私密片段:他们的家居环境、物品和日常习惯。理解他们在镜头前忙碌时可能无意中录下的个人敏感信息并不容易,这类视频的审核未必能过滤掉除明显标识之外的所有敏感内容。

对于有家庭的工人来说,把私人生活留在镜头之外是一场持续的博弈。有两个女儿的阿琼必须不断把两岁大的女儿从画面中赶走。“有时候很难工作,因为我的女儿太小了,”他说。

尼日利亚的一位银行职员莎莎(Sasha)在共用住宅区晾衣服时小心翼翼,以免拍到邻居——那些邻居正困惑地看着她。

在家中训练人形机器人的零工

接受《麻省理工科技评论》采访的工人明白,他们的数据正被用于训练机器人,但没有人知道这些数据将如何被使用、存储以及与第三方共享,包括Micro1向其出售数据的机器人公司。安萨里表示,出于保密原因,Micro1不会透露客户名称,也不会告知工人他们所参与的具体项目内容。

马里兰大学以人为中心计算教授亚斯明·科图里说:“如果工人参与这项工作,公司必须亲自告知他们此类技术可能的发展方向,以及这可能会对他们产生怎样的长期影响。”

一些工人偶尔会在公司Slack频道中询问,公司是否能删除他们的数据。Micro1拒绝就此类数据是否会被删除发表评论。

安萨里说:“人们是自愿选择做这项工作的,他们随时可以停止。”

对数据的渴求

由于成千上万的工人在家以不同的方式完成家务,一些机器人专家怀疑从他们那里收集的数据是否足够可靠,能够安全地训练机器人。

ASTM国际织的机器人专家 Aaron Prather 说:“我们在家里生活的方式并不总是符合安全标准。如果这些人教给机器人不良习惯,那就会引发事故,这样的数据就不合格。” 数据量庞大也让质量控制变得困难。不过安萨里表示,公司会拒绝那些展示不安全操作方式的视频,而笨拙的动作则有助于教会机器人什么是不该做的。

加州大学伯克利分校机器人专家肯·戈德堡说:“要达到这个目标还需要很长时间。大型语言模型训练所用的文本和图像,人类需要花十万年才能读完,而人形机器人可能需要更多的数据,因为控制机械关节比生成文本复杂得多。‘这比人们想象的还要久。’”

在印度一个繁忙的技术中心,一名叫达图的工程学学生每天上完大学课程回到家后,顾不上吃晚饭,便冲到狭小的阳台上——那里堆满了盆栽和哑铃。他把iPhone绑在额头,反复拍摄自己折叠同一套衣服的过程。

家人看着他一脸困惑。“对他们来说,这就像某种太空科技。”他说。当他告诉朋友自己的工作时,“他们会震惊于居然有人靠录家务就能赚钱。”

一边兼顾大学学业,一边进行数据录制和其他数据标注工作,让他感到疲惫不堪。但他仍觉得,“你做的事和全世界其他人不一样。”

训练人形机器人的零工正在家中进行

机器人社交网络的流行揭示了我们当前对人工智能的狂热,这比它揭示代理未来的前景更深刻。

OpenAI正全力以赴打造一名全自动研究员。

独家专访OpenAI首席科学家雅库布·帕霍茨基,探讨该公司新的宏伟挑战及人工智能的未来。

《Pokémon Go》如何为配送机器人提供精准的世界视角

独家报道:Niantic的人工智能衍生公司正利用玩家上传的300亿张城市地标图像,训练一种全新的世界模型。

保持连接

获取来自《麻省理工科技评论》的最新动态

发现特别优惠、热门新闻、即将举行的活动等信息。

来源与参考

  1. 原始链接
  2. The gig workers who are training humanoid robots at home

收录于 2026-04-02