OpenAI发布GPT-5.5，以双倍API价格提供代理型智能能力

The Decoder·4月25日 16:38 UTC·作者 Matthias Bastian

关键信息

GPT-5.5在编程和数学基准测试中取得最高分，同时比GPT-5.4完成相同任务所需token更少；但独立测试显示其存在明显的幻觉问题。Pro版本针对高精度工作优化，适用于高强度推理负载。

资讯摘要

OpenAI发布了GPT-5.5，称其为一种‘新型智能’，可跨代码编辑器、网络浏览器和电子表格等多种工具自主完成任务。它在编程和数学基准测试中超越了Claude Opus 4.7和Gemini 3.1 Pro，但并非所有领域都领先。GPT-5.5及其Pro版本现已通过API提供，支持一百万token上下文窗口。

尽管API价格翻倍，但由于每项任务所需的token减少，实际成本有所下降。OpenAI还指出，GPT-5.5通过分析流量模式优化了自身基础设施，改进了负载均衡，使token生成速度提升超过20%。

资讯正文

OpenAI发布GPT-5.5，称其为‘全新类别的智能’，API价格翻倍

要点

- OpenAI发布了GPT-5.5，这是一种基于代理的模型，能够自主处理复杂任务，如编写代码、执行在线搜索和跨多个工具分析数据。

- 该模型在关键基准测试中击败了竞争对手，包括Anthropic的Claude Opus 4.7和Google的Gemini 3.1 Pro，特别是在编程和高级数学方面表现优异，同时保持了速度优势，尽管并非所有领域都排名第一。

- 更强大的GPT-5.5 Pro版本也已推出，作为迭代研究伙伴，两个模型现在对付费ChatGPT和Codex用户开放，涵盖Plus、Pro、Business和Enterprise计划；API访问即将上线，但价格是之前的两倍。

更新——

- 增加了API可用性信息

2026年4月25日更新：

GPT-5.5和GPT-5.5 Pro现已通过OpenAI的Responses和Chat Completions API提供，每个模型支持一百万token的上下文窗口。OpenAI表示：“使用GPT-5.5构建的代理可以规划、收集上下文、调用工具、从模糊状态中恢复，并在较少指导的情况下完成更长的工作流程。”公司称，GPT-5.5 Pro专为“更高精度工作”设计。

独立测试实验室Artificial Analysis已对GPT-5.5进行了基准测试：OpenAI的新模型以微弱优势超过Anthropic的Claude和Google的Gemini，但在幻觉问题上存在明显弱点。根据该实验室的数据，有效API成本比GPT-5.4高出约20%——虽然纸面上的token价格翻倍，但每项任务使用的token减少，部分抵消了这一涨幅。

原始文章发布于2026年4月23日：

OpenAI宣布推出GPT-5.5，这是一种旨在跨多种工具自主处理复杂任务的代理模型。从纸面价格来看，其API费用翻了一倍。

OpenAI发布了GPT-5.5，称其为‘适用于实际工作的新型智能，可驱动代理’。公司表示，该模型旨在理解复杂目标、使用工具、验证自身输出，并独立完成任务直至结束。目前该模型已向付费ChatGPT和Codex用户开放。

代理工作流是主要卖点

据OpenAI介绍，GPT-5.5特别擅长编写和调试代码、网络研究、数据分析、创建文档和电子表格以及操作软件。该模型能自主切换不同工具，直到任务完成。

OpenAI认为，GPT-5.5在四个领域取得最大进步：代理编程、计算机使用、知识型工作和早期科学研究。这些领域需要跨情境推理能力以及长时间持续执行动作的能力。

OpenAI表示，GPT-5.5实现了这些性能提升，同时不牺牲速度。据报道，该模型的每token延迟与GPT-5.4相当，且完成相同Codex任务时使用的token显著减少。

OpenAI的GPT-5.5基准对比图。GPT-5.5 Pro仅在部分基准上进行了测试。 | 表格：OpenAI

GPT-5.5在GDPval这一衡量44个职业实际任务表现的基准测试中几乎没有提升。GPT-5.5得分为84.9%，仅比GPT-5.4的83.0%略有进步。所有基准测试的完整详情可在此处查看。

该模型与NVIDIA GB200和GB300-NVL72系统共同开发并优化。OpenAI表示，GPT-5.5和Codex实际上帮助优化了公司自身的服务基础设施——Codex分析了生产流量模式，并编写了自己的负载均衡启发式算法，使令牌生成速度提升了超过20%。“这个模型帮助改进了为其提供服务的基础架构，”OpenAI写道。

GPT-5.5 Pro旨在成为“研究伙伴”

除了标准版本外，OpenAI还推出了GPT-5.5 Pro。该公司称，全栈推理性能的改进使得这款更强大的模型更适合高负载任务。早期测试者将其称为迭代式的“研究伙伴”，当提供来自文档和插件的丰富上下文时表现最佳。

截至目前，OpenAI仅分享了GPT-5.5 Pro在九项测试中的三项结果：BrowseComp、FrontierMath Tier 1-3以及FrontierMath Tier 4。它在这三项测试中均优于基础模型。

网络安全能力被评为“高”级别

同时，OpenAI正在推出更严格的潜在网络风险分类器，这可能导致初期出现更多拒绝请求。Trusted Access for Cyber项目将为经验证的安全研究人员提供扩展的网络安全功能访问权限。OpenAI还在与政府合作伙伴合作保护关键基础设施。带有更多安全细节的系统卡片可在此处查看。

付费用户优先获得访问权；API定价是GPT-5.4的两倍

对于API，OpenAI目前定价为每百万输入token 5美元，每百万输出token 30美元，上下文窗口为一百万token，正好是GPT-5.4价格（分别为2.50美元和15美元）的两倍。GPT-5.5 Pro的定价则为每百万输入token 30美元，每百万输出token 180美元。

OpenAI认为，尽管价格更高，但GPT-5.5效率更高，在完成类似任务时所需token更少。目前尚不清楚免费用户何时能获得访问权限。至于API，OpenAI表示将“很快”上线。

来源与参考

收录于 2026-04-26