ChatGPT推出GPT-5.5 Instant并提升记忆来源透明度
The Decoder··作者 Matthias Bastian
关键信息
OpenAI 表示,GPT-5.5 Instant 在医学、法律和金融等高风险提示上的幻觉性陈述比 GPT-5.3 Instant 少 52.5%,在用户曾标记为易出错的困难对话中,不准确陈述减少了 37.3%。此外,MMMU-Pro 从 69.2 提升到 76.0,OmniDocBench 的错误率则从 14.6 降至 12.5。
资讯摘要
OpenAI 正在把 GPT-5.5 Instant 作为 ChatGPT 的新默认模型,并用它替换 GPT-5.3 Instant。公司表示,这个新模型旨在减少幻觉、收紧回答,并提升数学、科学和视觉推理任务的表现。根据 OpenAI 的内部测试,GPT-5.5 Instant 在医学、法律和金融等高风险提示中的幻觉性陈述减少了 52.5%。在用户先前标记为有事实错误的困难对话中,不准确陈述减少了 37.3%。OpenAI 还举了一个代数题示例,说明 GPT-5.5 Instant 能先识别用户的计算错误,再纠正其错误移项并解出正确的二次方程结果。
该模型的基准成绩也有所提升,MMMU-Pro 从 69.2 提升到 76.0,OmniDocBench 的错误率则从 14.6 降到 12.5。除了模型更新外,OpenAI 还推出了“记忆来源”功能,向用户显示某条回复使用了哪些存储上下文,例如保存的备注、过去的聊天记录或上传的文件。用户可以把条目标记为相关或不相关,也可以编辑或删除,不过 OpenAI 也说明,来源视图并不会总是展示一条回复背后的全部因素。GPT-5.5 Instant 现在已向所有 ChatGPT 用户开放,而基于过去聊天、文件和 Gmail 的高级个性化功能则先面向网页端的 Plus 和 Pro 用户,之后还会逐步扩展。

资讯正文
ChatGPT 更新推出 GPT-5.5 Instant,幻觉更少,答案更具个性化
要点
- OpenAI 正在将 ChatGPT 的默认模型替换为 GPT-5.5 Instant。与此前版本相比,这一模型在医学、法律和金融等高风险话题上的幻觉率降低了 52.5%,同时在数学、科学和视觉推理方面的基准表现也有显著提升。
- 一项新的“memory sources”功能现在会向用户显示某条回复所依据的个人上下文——包括过往聊天、保存的提醒事项或上传的文件——用户还可以更正或移除单个条目。
- GPT-5.5 Instant 现已开始向所有 ChatGPT 用户推出,但通过过往聊天、文件和 Gmail 实现的高级个性化功能,最初仅限于 Plus 和 Pro 订阅用户,随后几周将逐步扩大可用范围。
OpenAI 正在把 ChatGPT 的默认模型换成 GPT-5.5 Instant。这次更新减少了幻觉并收紧了回答;与此同时,一项名为“memory sources”的新功能会向用户展示哪些已存储上下文影响了某条回复。
GPT-5.5 Instant 取代了 GPT-5.3 Instant,也可通过 API 以“chat-latest”名称使用。根据 OpenAI 的内部测试,在医学、法律和金融领域的高风险提示词上,GPT-5.5 Instant 产生的幻觉性陈述比前代少了 52.5%。OpenAI 称,在用户此前因事实错误而标记过的棘手对话中,不准确说法减少了 37.3%。
OpenAI 以一道代数题为例。用户上传了一张手写方程的照片,其中包含一个计算错误。GPT-5.3 Instant 起初同意了该解法,随后注意到 x=3 行不通,但又错误地得出没有实数解的结论。GPT-5.5 Instant 也一开始认同了用户的计算,但随后识别出用户在重排方程时出现的错误,并解出了修正后的二次方程。
用于衡量模型在文本和图像中处理专家级问题能力的 MMMU-Pro,得分从 69.2% 提升到 76.0%。用于测试从复杂文档中提取结构化数据的 OmniDocBench,其错误率从 14.6% 降至 12.5%。
更简洁的回答与更智能的个性化
OpenAI 还重点削减了冗余内容。公司表示,回答更短,但不会损失实质内容;模型会减少不必要的追问,删除多余的表情符号,并跳过繁重的格式设置。“它可以传递相同的信息,而且往往比之前的模型更有用,同时减少那些会让回复过长的冗长表述和过度格式化,”OpenAI 写道。
当这些功能开启时,模型还会更好地利用过往聊天、上传文件以及已连接的 Gmail 账户中的上下文。据称,GPT-5.5 Instant 在判断额外个性化何时真正有助于回复方面更为出色,而且检索先前对话的速度也更快。
OpenAI 还在所有 ChatGPT 模型中推出 memory sources。当前,一条回复如果调用了已存储的上下文,用户现在就能看到使用了哪些信息,无论是保存的笔记还是过往聊天。相关条目可以被标记为相关或不相关,也可以被编辑或删除。
不过,OpenAI表示,记忆来源并不会总是显示出某个回答背后的每一个因素。例如,只有模型搜索到的部分对话才会作为来源显示。公司计划随着时间推移让这一视图变得更完整。共享聊天时不会传递记忆来源,而临时聊天既不会读取记忆,也不会更新记忆。
分阶段向各套餐推出
OpenAI表示,GPT-5.5 Instant 现在开始面向所有 ChatGPT 用户推出。付费用户在接下来的三个月里,仍可通过模型设置继续使用 GPT-5.3 Instant,之后它将被退役。
基于过去聊天、文件和 Gmail 的增强个性化功能,首先会向网页端的 Plus 和 Pro 用户推出,移动端也即将上线。Free、Go、Business 和 Enterprise 套餐预计将在未来几周内获得访问权限。记忆来源将先在网页端面向所有消费级套餐推出,随后跟进移动端。某些个性化功能在不同地区可能并不可用。
OpenAI 最近推出了 GPT-5.5 Thinking,作为更高层级的模型,而 GPT-5.5 Instant 则作为 ChatGPT 的日常默认模型。Thinking 版本仍然更强大:据报道,在网络安全任务上它可与 Claude Mythos 持平,并且它取代了专门的 Codex 编码模型。
来源与参考