ChatGPT语音模式使用较旧较弱的模型

Simon Willison·4月10日 23:56 UTC·作者 Simon Willison

关键信息

语音模式的知识截止日期是2024年4月，表明它使用的是GPT-4o的老版本，而非最新的GPT-4 Turbo模型。安德烈·卡帕西的推文强调，不同领域（如代码与对话）因商业价值和训练可行性不同而获得不同程度的优化。

资讯摘要

西蒙·威尔森指出，ChatGPT的语音模式运行在比其文字版更老、更弱的模型上，尽管语音功能常被视为高级特性。该语音模式的知识截止日期为2024年4月，意味着它缺乏后续版本的更新。这一差异得到了安德烈·卡帕西的进一步解释：OpenAI之所以优先提升编码等高价值领域，是因为这些任务有明确的奖励信号（如单元测试通过与否），且商业回报更高。

因此，用于代码的Codex工具远比免费的高级语音模式强大，尽管它们基于相似的基础模型。这引发了关于公平性、用户预期以及AI公司如何分配资源的重要讨论。

资讯正文

2026年4月10日

很多人可能没有意识到，OpenAI的语音模式实际上运行在一个更古老、更弱的模型上——你和它对话时感觉应该是个最聪明的AI，但实际上并非如此。

如果你问ChatGPT语音模式它的知识截止日期，它会告诉你2024年4月，这说明它用的是GPT-4o时代的模型。

这个想法源于安德烈·卡帕西（Andrej Karpathy）的一条推文，他指出：人们使用模型的方式和场景不同，导致对AI能力的理解差距越来越大。

[...] 实际情况是，OpenAI的免费版本，我认为有点被忽视的“高级语音模式”，在你的Instagram短视频里面对最简单的问题也会答不上来；与此同时，OpenAI最高级别的付费Codex模型却能连续工作一小时，有条理地重构整个代码库，或者发现并利用计算机系统的漏洞。这部分功能真的非常强大，并取得了显著进步，原因有两个：第一，这些领域提供了明确且可验证的奖励函数，意味着它们更容易进行强化学习训练（例如单元测试通过与否很容易判断，而写作则很难明确评判）；第二，这些领域在企业级（B2B）场景中价值更高，因此团队中最大比例的人力都集中在改进它们。

[...] 实际情况是，OpenAI的免费版本，我认为有点被忽视的“高级语音模式”，在你的Instagram短视频里面对最简单的问题也会答不上来；与此同时，OpenAI最高级别的付费Codex模型却能连续工作一小时，有条理地重构整个代码库，或者发现并利用计算机系统的漏洞。

这部分功能真的非常强大，并取得了显著进步，原因有两个：

这些领域提供了明确且可验证的奖励函数，意味着它们更容易进行强化学习训练（例如单元测试通过与否很容易判断，而写作则很难明确评判）；但同时也因为它们在企业级（B2B）场景中价值更高，因此团队中最大比例的人力都集中在改进它们。

近期文章

Meta的新模型叫Muse Spark，而meta.ai聊天功能有一些有趣的工具——2026年4月8日

Anthropic的Project Glasswing项目将Claude Mythos限制给安全研究人员使用，我觉得这是必要的——2026年4月7日

Axios供应链攻击使用了针对个体的社会工程手段——2026年4月3日

这是西蒙·威尔森（Simon Willison）于2026年4月10日发布的笔记。

月度简报

每月赞助我10美元，即可获得当月最重要的大语言模型进展精选邮件摘要。

付钱让我发得更少！

免责声明

题记

2002

2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

2013

2014

2015

2016

2017

2018

2019

2020

2021

2022

2023

2024

2025

2026

来源与参考

收录于 2026-04-11