ChatGPT语音模式使用较旧较弱的模型
Simon Willison··作者 Simon Willison
关键信息
语音模式的知识截止日期是2024年4月,表明它使用的是GPT-4o的老版本,而非最新的GPT-4 Turbo模型。安德烈·卡帕西的推文强调,不同领域(如代码与对话)因商业价值和训练可行性不同而获得不同程度的优化。
资讯摘要
西蒙·威尔森指出,ChatGPT的语音模式运行在比其文字版更老、更弱的模型上,尽管语音功能常被视为高级特性。该语音模式的知识截止日期为2024年4月,意味着它缺乏后续版本的更新。这一差异得到了安德烈·卡帕西的进一步解释:OpenAI之所以优先提升编码等高价值领域,是因为这些任务有明确的奖励信号(如单元测试通过与否),且商业回报更高。
因此,用于代码的Codex工具远比免费的高级语音模式强大,尽管它们基于相似的基础模型。这引发了关于公平性、用户预期以及AI公司如何分配资源的重要讨论。
资讯正文
2026年4月10日
很多人可能没有意识到,OpenAI的语音模式实际上运行在一个更古老、更弱的模型上——你和它对话时感觉应该是个最聪明的AI,但实际上并非如此。
如果你问ChatGPT语音模式它的知识截止日期,它会告诉你2024年4月,这说明它用的是GPT-4o时代的模型。
这个想法源于安德烈·卡帕西(Andrej Karpathy)的一条推文,他指出:人们使用模型的方式和场景不同,导致对AI能力的理解差距越来越大。
[...] 实际情况是,OpenAI的免费版本,我认为有点被忽视的“高级语音模式”,在你的Instagram短视频里面对最简单的问题也会答不上来;与此同时,OpenAI最高级别的付费Codex模型却能连续工作一小时,有条理地重构整个代码库,或者发现并利用计算机系统的漏洞。这部分功能真的非常强大,并取得了显著进步,原因有两个:第一,这些领域提供了明确且可验证的奖励函数,意味着它们更容易进行强化学习训练(例如单元测试通过与否很容易判断,而写作则很难明确评判);第二,这些领域在企业级(B2B)场景中价值更高,因此团队中最大比例的人力都集中在改进它们。
[...] 实际情况是,OpenAI的免费版本,我认为有点被忽视的“高级语音模式”,在你的Instagram短视频里面对最简单的问题也会答不上来;与此同时,OpenAI最高级别的付费Codex模型却能连续工作一小时,有条理地重构整个代码库,或者发现并利用计算机系统的漏洞。
这部分功能真的非常强大,并取得了显著进步,原因有两个:
这些领域提供了明确且可验证的奖励函数,意味着它们更容易进行强化学习训练(例如单元测试通过与否很容易判断,而写作则很难明确评判);但同时也因为它们在企业级(B2B)场景中价值更高,因此团队中最大比例的人力都集中在改进它们。
近期文章
Meta的新模型叫Muse Spark,而meta.ai聊天功能有一些有趣的工具——2026年4月8日
Anthropic的Project Glasswing项目将Claude Mythos限制给安全研究人员使用,我觉得这是必要的——2026年4月7日
Axios供应链攻击使用了针对个体的社会工程手段——2026年4月3日
这是西蒙·威尔森(Simon Willison)于2026年4月10日发布的笔记。
月度简报
每月赞助我10美元,即可获得当月最重要的大语言模型进展精选邮件摘要。
付钱让我发得更少!
免责声明
题记
©
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
2026
来源与参考
收录于 2026-04-11