Origin Lab 融资 800 万美元打造游戏数据市场

TechCrunch AI··作者 Russell Brandom

关键信息

Origin Lab 表示,它会充当游戏公司与 AI 实验室之间的中介,把游戏资产转换成训练数据,方式可以从渲染流程到自动化通关录像不等。文章还提到,这一领域长期存在授权和数据质量问题,包括 OpenAI 在 2024 年因 Sora 似乎复现游戏和主播视频片段而引发的争议。

资讯摘要

随着 AI 开始从纯语言任务走向物理世界,研究人员正在构建“世界模型”,让机器理解物体如何运动、环境如何变化。TechCrunch 指出,这类模型面临的核心难题之一是数据:与文本不同,训练世界模型并没有一个现成的大规模数据来源。Origin Lab 试图用视频游戏行业来填补这一缺口。

该公司宣布完成 800 万美元种子轮融资,由 Lightspeed Ventures 领投,SV Angel、Eniac、Seven Stars、FPV 以及 Twitch 联合创始人 Kevin Lin、Cruise 创始人 Kyle Vogt 等天使投资人参与。Origin Lab 的联合 CEO 和联合创始人包括 Anne-Margot Rodde、Antoine Gargot 和 Colin Carrier。

Rodde 告诉 TechCrunch,AI 系统要理解物理世界所需的数据,其实已经存在于视频游戏中。Origin Lab 的计划是建立一个市场,一边让游戏公司把数字资产授权出去赚钱,另一边让 AI 实验室购买高质量训练数据。Origin Lab 则位于中间,把游戏资产转换成适合模型训练的形式,例如渲染流程,或者自动化采集的通关录像。

文章称,像 Yann LeCun 的 AMI Labs 和 Fei-Fei Li 的 World Labs 这样的世界模型实验室,可能会成为这类数据的买家。文章还指出,研究者很早就对视频游戏视频感兴趣,但授权问题和数据质量问题一直阻碍着更大规模的应用。

TechCrunch 提到一个近期案例:在 2024 年 12 月,OpenAI 的第一版 Sora 视频生成模型似乎复现了热门游戏和主播的视频片段,外界推测原因是其训练数据包含 Twitch 流媒体内容。Amazon 也公开表示过有意使用 Twitch 视频训练模型。Lightspeed 合伙人 Faraz Fatemi 认为,Scale AI 等公司的成功说明,只要服务于大型 AI 实验室,数据供应商就能快速增长,因为这些客户资金充足,而真正的瓶颈是数据。

Origin Lab 融资 800 万美元打造游戏数据市场

资讯正文

随着 AI 开始与物理世界互动,出现了一类新的实验室,致力于构建世界模型,这些模型可用于操控实体机器人,或对物理空间中的物体进行建模。与大型语言模型不同,这类模型并没有一个容易获取的数据来源,这让许多实验室不得不四处搜集所需的训练集。

如今,一家初创公司正以一个出人意料的数据来源浮出水面:电子游戏行业。

这正是 Origin Lab 的设想。该公司刚刚宣布完成由 Lightspeed Ventures 领投的 800 万美元种子轮融资。SV Angel、Eniac、Seven Stars 和 FPV 也参与了本轮融资,Twitch 联合创始人 Kevin Lin 和 Cruise 创始人 Kyle Vogt 还提供了天使投资。

“现在正在构建的 AI 系统需要理解物理世界如何运作、事物如何移动,”联合 CEO 兼联合创始人 Anne-Margot Rodde 告诉 TechCrunch。“这些数据本质上就存在于电子游戏里。”公司的另外两位联合创始人(如上图所示)是 Antoine Gargot 和 Colin Carrier。

简单来说,Origin Lab 将充当一个市场,专注于世界模型的实验室,例如 Yann LeCun 的 AMI Labs 或 Fei-Fei Li 的 World Labs,可以在这里购买高质量的授权数据。交易的另一端,电子游戏公司则可以从他们已经创建的数字资产中榨取额外收入。而在中间,Origin Lab 会把这些游戏资产转换成可用于训练的数据形式——这可能只是一次渲染运行,也可能复杂到自动生成数小时的通关录像。

Rodde 说:“很明显,电子游戏行业手里掌握着一些极其有价值的数据,但当时并没有真正可行的方式或基础设施,能够把 AI 实验室和电子游戏行业基本连接起来。所以本质上,我们搭建了那座桥梁。”

实验室长期以来一直对电子游戏录像作为数据来源感兴趣,但授权和数据质量问题往往成为阻碍。2024 年 12 月,OpenAI 因其视频生成模型 Sora 的首个版本似乎会复现热门电子游戏和主播的画面而引发了一场小风波——推测原因是它在 Twitch 直播流上进行了训练。亚马逊也公开表示过,它有兴趣使用 Twitch 录像来训练模型。

Origin 在融资上的成功表明,这一市场正在增长——不仅是训练数据市场,也包括那些能够成为大型 AI 实验室关键供应商的初创公司。Lightspeed 负责领投 Origin 投资的合伙人 Faraz Fatemi 表示,Scale AI 等公司的成功已经让这一机会无法忽视。

Fatemi 告诉 TechCrunch:“我们已经看到,为大型实验室提供服务的数据供应商,其营收扩张速度可以有多快。这些都是资金非常充足的业务,而它们共同的瓶颈就是数据。”

被裁员的 Oracle 员工试图协商更好的遣散费。Oracle 拒绝了。

来源与参考

  1. 原始链接
  2. Origin Lab raises $8M to help video game companies sell data to world-model builders | TechCrunch

收录于 2026-05-14