Thinking Machines推出实时交互模型

The Verge AI··作者 Jay Peters

关键信息

Thinking Machines 认为,现有模型仍然处于“单线程”状态,只能等用户说完或输入完才回应,而且在生成回答时感知会被冻结。公司表示,其目标是消除这种带宽瓶颈,但该产品目前还不能试用;计划在未来几个月推出有限研究预览,并在今年晚些时候扩大发布。

资讯摘要

Thinking Machines 是由前 OpenAI CTO Mira Murati 创立的 AI 公司,它在周一宣布正在研发一种名为“交互模型”的新系统。公司将这类模型描述为能够像人类自然协作那样与用户配合的 AI:它们会持续接收音频、视频和文本,并实时思考、回应和行动。Thinking Machines 解释说,今天的模型通常以“单线程”方式运行,也就是要等用户打完字或说完话才会反应,而在生成回答时又会暂停接收新的信息。公司认为,这种方式限制了人类的知识、意图和判断传递给模型的程度,也让用户更难理解模型正在做什么。为说明这一点,Thinking Machines 把当前的交互方式比作“通过邮件而不是面对面”去解决一场重要分歧。

该公司表示,交互模型的目标是消除这种“带宽瓶颈”,让 AI 能在任何模态下实时交互,从而让界面适应人,而不是让人去迁就 AI。Thinking Machines 还展示了几个应用场景,例如在故事中监听动物提及、实时翻译语音,以及在用户驼背时提醒对方。公司称,关于交互模型的更深入说明可以在其官网上看到,但目前还不能直接体验这一系统。Thinking Machines 计划在未来几个月推出有限的研究预览,并希望在今年晚些时候进行更大范围的发布。Murati 于 2025 年 2 月离开 OpenAI 后创办了 Thinking Machines,而这家实验室随后已经经历了多次重要人员流失,包括有人跳槽到 Meta,甚至有人回到 OpenAI。

Thinking Machines推出实时交互模型

资讯正文

Thinking Machines 由前 OpenAI CTO Mira Murati 创立,这家 AI 公司周一宣布,他们正在开发一种名为“interaction models”的东西。根据 Thinking Machines 的说法,interaction models 的理念是让人们能够“像我们彼此自然协作那样与 AI 协作——它们会持续接收音频、视频和文本,并实时思考、响应和行动。”

正如 Thinking Machines 所解释的:

> 如今的模型是以单线程方式体验现实的。在用户打字或说话结束之前,模型会在没有感知用户正在做什么或用户是如何做的情况下等待。在模型完成生成之前,它的感知会被冻结,在完成或被打断之前不会接收任何新信息。这就在人类与 AI 的协作之间造成了一条狭窄的通道,限制了一个人的知识、意图和判断有多少能够传递给模型,以及模型的工作有多少能够被理解。试想一下,通过电子邮件而不是面对面来化解一场至关重要的分歧。

> 在 Thinking Machines,我们相信可以通过让 AI 在任何模态下都能实时交互来解决这一带宽瓶颈。这使得 AI 界面能够在人的所在之处与人相遇,而不是强迫人们为了适应 AI 界面而把自己扭曲变形。

Thinking Machines 还分享了该模型运行中的几个示例,包括在故事中识别动物提及、实时翻译语音,以及在某人驼背时提醒他或她。

你可以在 Thinking Machines 网站上阅读关于 interaction models 的更深入解释。不过,你现在还不能亲自试用 interaction models;Thinking Machines 计划在“未来几个月”开放一个“有限研究预览”,并打算在“今年晚些时候”进行“更广泛的发布”。

Murati 在 2025 年 2 月离开 OpenAI 后创立了 Thinking Machines。这家 AI 实验室已经不得不应对多次重大人员流失,核心成员转投 Meta,甚至还有人回到了 OpenAI。

来源与参考

  1. 原始链接
  2. Here’s what Mira Murati’s AI company is up to

收录于 2026-05-13