AI公司付费征集家务视频训练机器人

The Verge AI··作者 Robert Hart

关键信息

文章强调,机器人必须处理运动、力量、摩擦、奇怪的形状、材料和光照条件,因此家务劳动远比文本类AI任务更难自动化。有些公司通过可穿戴摄像设备采集第一人称视角数据,另一些则让人反复执行同样的体力任务来搭建“数据农场”,还有公司直接使用已经部署到客户家中的机器人所产生的素材。

资讯摘要

《The Verge》报道,AI 和机器人公司正越来越愿意为人们做家务时的视频付费,因为这些数据对训练机器人在真实物理世界中工作至关重要。名为 Shift 的AI训练初创公司表示,它将为纽约人的家庭提供免费清洁服务,并计划扩展到包括伦敦在内的其他城市,但作为交换,它希望拍摄清洁工擦洗碗碟、擦台面、掸灰和拖地的工作视频。文章指出,这并不只是为了提供便利服务,而是为了收集机器人学习所必需的真实物理数据。与聊天机器人或图像生成器不同,机器人必须理解空间、运动、力量、摩擦、复杂光照和不规则材料,这使得人类看来很简单的任务,例如叠衣服或倒水,都很难被机器编码和学习。由于物理世界不像文本和图片那样容易从互联网上大规模抓取,高质量数据已成为具身AI的主要瓶颈。文章还提到其他类似做法:在印度,Pronto 被报道把客户家中作为家务AI训练素材来源,尽管它声称只有在客户明确同意后才会录制。

该做法引发了市场强烈反弹,竞争对手也纷纷表示自己从未在住户家中录制训练AI的视频,也无此计划。其他公司,如位于硅谷的 Human Archive,则试图通过让零工劳动者佩戴带摄像头的帽子来规模化采集数据。与此同时,Shift 还声称已在 15 个国家向数万人支付报酬,让他们通过应用程序记录自己的活动。文章还描述了“数据农场”这种做法,即让工人一遍又一遍重复同样的体力动作,由摄像头和传感器完整记录,用来生成训练素材。最后,文章指出,一些数据甚至会来自已经在用户家中运行的机器人本身,当机器人卡住时,远程工作人员会介入,而这些救援过程也会继续产生可用于训练的数据。

AI公司付费征集家务视频训练机器人

资讯正文

本周,一家名为 Shift 的 AI 训练初创公司表示,它将免费为纽约人的家里做清洁。它还计划扩展到其他城市,包括伦敦,而看着我自己的公寓,我也能理解这种吸引力。

但有个条件。总会有个条件。

作为清洁的交换,Shift 想要的是清洁工工作时的影像:刷洗餐具、擦拭台面、掸桌子、拖地。它什么都想要。它想要所有那些我们要是能外包就乐意外包的无聊家务劳动的视频——而机器人公司正竞相教机器去做这些事,好把它们卖给我们,让它们替我们干活。

这比听起来更难。与近年来爆发式增长的聊天机器人、图像生成器和其他 AI 工具不同,机器人必须应对物理世界。这意味着它们要理解空间、运动、力量、摩擦、奇形怪状的形体和材料、别扭的光线,以及人类——还有其他有机体——往往凭直觉就能掌握的一切。正因如此,那些对我们来说通常很容易的事情,比如叠衣服、捡起一个苹果,或倒一杯水,却让机器人研究人员在将其程序化时感到异常棘手。

教机器做这些事情需要数据,而且是大量数据。文本、图像和视频可以在工业规模上轻易从互联网上抓取。而且它们确实被抓取了,往往还没有向创作者支付报酬。物理世界更难抓取,也更难在不付费的情况下悄悄抓取。这意味着,高质量数据的获取是开发具身 AI 的公司面临的巨大瓶颈。这是一个利润丰厚的机会,因此像 Shift 这样的公司正在想出各种新办法。

它们并不孤单。在印度,近期报道披露,家政服务平台 Pronto 一直在把客户的家当作 AI 训练素材来源,用于烹饪、清洁和洗衣等家务场景。Pronto 表示,只有在客户明确选择加入时才会录制影像——目前尚不清楚客户因此能得到什么回报,除了那份影像副本之外——但这种做法仍然在市场上引发了一波强烈反弹,竞争对手初创公司纷纷坚称,他们从未在住宅内录制影像来训练 AI,也没有计划这么做。

还有一些初创公司则把重点放在扩大数据采集规模上。例如,总部位于硅谷的 Human Archive 希望与 Pronto 这样的公司合作,并让零工劳动者戴上不太时髦的摄像帽来记录自己的活动。这样的帽子会从佩戴者的视角收集影像,正是机器人公司所需要的那种“自我中心”或第一人称数据,用来教机器理解人们如何在物理空间中行动。与此同时,Shift 也直接接触消费者,并称自己已向 15 个国家的数万人支付报酬,让他们通过其应用记录自己的活动。

还有一些公司则干脆跳过有用工作本身。取而代之的是,工人被付钱一次又一次地完成完全相同的体力任务,而摄像头和传感器则记录下每一个动作。这样的人工数据农场旨在把例行的体力劳动——叠毛巾、捡杯子、搬箱子——转化为 AI 训练材料,而这些材料的价值足以证明向人们付费让他们制造这些数据是合理的。

而且,有些数据已经由现实世界中的机器人生成。尽管炒作得很热,真正的自动化距离实现仍然很远——这也正是为什么需要这么多数据——但企业仍然急于先把产品推向市场。他们会利用来自客户家中的数据来改进产品。许多公司还依赖远程工作人员在机器人不可避免地卡住时介入。他们也会使用这些数据。

当然,用数据交换某种有价值的东西,这并不是什么新鲜事。多年来,公司一直在用折扣、便利和免费服务来换取你对数据的访问,从会员卡和 Cookies,到行车记录仪、监测人们驾驶方式的保险应用程序,再到那种总是在播放广告的可恶智能电视,莫不如此。

新鲜之处在于,公司愿意为哪一种数据付费。就目前而言,这意味着也许先让一个真人戴着花哨的帽子免费帮你打扫房子,以便将来某家公司能卖给你一台机器人来替你做这件事。

来源与参考

  1. 原始链接
  2. Tech companies desperately want to film you doing chores

收录于 2026-05-30