ChatGPT推出GPT-5.5 Instant并提升记忆来源透明度

The Decoder·5月6日 02:04 UTC·作者 Matthias Bastian

关键信息

OpenAI 表示，GPT-5.5 Instant 在医学、法律和金融等高风险提示上的幻觉性陈述比 GPT-5.3 Instant 少 52.5%，在用户曾标记为易出错的困难对话中，不准确陈述减少了 37.3%。此外，MMMU-Pro 从 69.2 提升到 76.0，OmniDocBench 的错误率则从 14.6 降至 12.5。

资讯摘要

OpenAI 正在把 GPT-5.5 Instant 作为 ChatGPT 的新默认模型，并用它替换 GPT-5.3 Instant。公司表示，这个新模型旨在减少幻觉、收紧回答，并提升数学、科学和视觉推理任务的表现。根据 OpenAI 的内部测试，GPT-5.5 Instant 在医学、法律和金融等高风险提示中的幻觉性陈述减少了 52.5%。在用户先前标记为有事实错误的困难对话中，不准确陈述减少了 37.3%。OpenAI 还举了一个代数题示例，说明 GPT-5.5 Instant 能先识别用户的计算错误，再纠正其错误移项并解出正确的二次方程结果。

该模型的基准成绩也有所提升，MMMU-Pro 从 69.2 提升到 76.0，OmniDocBench 的错误率则从 14.6 降到 12.5。除了模型更新外，OpenAI 还推出了“记忆来源”功能，向用户显示某条回复使用了哪些存储上下文，例如保存的备注、过去的聊天记录或上传的文件。用户可以把条目标记为相关或不相关，也可以编辑或删除，不过 OpenAI 也说明，来源视图并不会总是展示一条回复背后的全部因素。GPT-5.5 Instant 现在已向所有 ChatGPT 用户开放，而基于过去聊天、文件和 Gmail 的高级个性化功能则先面向网页端的 Plus 和 Pro 用户，之后还会逐步扩展。

资讯正文

ChatGPT 更新推出 GPT-5.5 Instant，幻觉更少，答案更具个性化

要点

- OpenAI 正在将 ChatGPT 的默认模型替换为 GPT-5.5 Instant。与此前版本相比，这一模型在医学、法律和金融等高风险话题上的幻觉率降低了 52.5%，同时在数学、科学和视觉推理方面的基准表现也有显著提升。

- 一项新的“memory sources”功能现在会向用户显示某条回复所依据的个人上下文——包括过往聊天、保存的提醒事项或上传的文件——用户还可以更正或移除单个条目。

- GPT-5.5 Instant 现已开始向所有 ChatGPT 用户推出，但通过过往聊天、文件和 Gmail 实现的高级个性化功能，最初仅限于 Plus 和 Pro 订阅用户，随后几周将逐步扩大可用范围。

OpenAI 正在把 ChatGPT 的默认模型换成 GPT-5.5 Instant。这次更新减少了幻觉并收紧了回答；与此同时，一项名为“memory sources”的新功能会向用户展示哪些已存储上下文影响了某条回复。

GPT-5.5 Instant 取代了 GPT-5.3 Instant，也可通过 API 以“chat-latest”名称使用。根据 OpenAI 的内部测试，在医学、法律和金融领域的高风险提示词上，GPT-5.5 Instant 产生的幻觉性陈述比前代少了 52.5%。OpenAI 称，在用户此前因事实错误而标记过的棘手对话中，不准确说法减少了 37.3%。

OpenAI 以一道代数题为例。用户上传了一张手写方程的照片，其中包含一个计算错误。GPT-5.3 Instant 起初同意了该解法，随后注意到 x=3 行不通，但又错误地得出没有实数解的结论。GPT-5.5 Instant 也一开始认同了用户的计算，但随后识别出用户在重排方程时出现的错误，并解出了修正后的二次方程。

用于衡量模型在文本和图像中处理专家级问题能力的 MMMU-Pro，得分从 69.2% 提升到 76.0%。用于测试从复杂文档中提取结构化数据的 OmniDocBench，其错误率从 14.6% 降至 12.5%。

更简洁的回答与更智能的个性化

OpenAI 还重点削减了冗余内容。公司表示，回答更短，但不会损失实质内容；模型会减少不必要的追问，删除多余的表情符号，并跳过繁重的格式设置。“它可以传递相同的信息，而且往往比之前的模型更有用，同时减少那些会让回复过长的冗长表述和过度格式化，”OpenAI 写道。

当这些功能开启时，模型还会更好地利用过往聊天、上传文件以及已连接的 Gmail 账户中的上下文。据称，GPT-5.5 Instant 在判断额外个性化何时真正有助于回复方面更为出色，而且检索先前对话的速度也更快。

OpenAI 还在所有 ChatGPT 模型中推出 memory sources。当前，一条回复如果调用了已存储的上下文，用户现在就能看到使用了哪些信息，无论是保存的笔记还是过往聊天。相关条目可以被标记为相关或不相关，也可以被编辑或删除。

不过，OpenAI表示，记忆来源并不会总是显示出某个回答背后的每一个因素。例如，只有模型搜索到的部分对话才会作为来源显示。公司计划随着时间推移让这一视图变得更完整。共享聊天时不会传递记忆来源，而临时聊天既不会读取记忆，也不会更新记忆。

分阶段向各套餐推出

OpenAI表示，GPT-5.5 Instant 现在开始面向所有 ChatGPT 用户推出。付费用户在接下来的三个月里，仍可通过模型设置继续使用 GPT-5.3 Instant，之后它将被退役。

基于过去聊天、文件和 Gmail 的增强个性化功能，首先会向网页端的 Plus 和 Pro 用户推出，移动端也即将上线。Free、Go、Business 和 Enterprise 套餐预计将在未来几周内获得访问权限。记忆来源将先在网页端面向所有消费级套餐推出，随后跟进移动端。某些个性化功能在不同地区可能并不可用。

OpenAI 最近推出了 GPT-5.5 Thinking，作为更高层级的模型，而 GPT-5.5 Instant 则作为 ChatGPT 的日常默认模型。Thinking 版本仍然更强大：据报道，在网络安全任务上它可与 Claude Mythos 持平，并且它取代了专门的 Codex 编码模型。

来源与参考