OpenAI发布GPT-5.5,以双倍API价格提供代理型智能能力

The Decoder··作者 Matthias Bastian

关键信息

GPT-5.5在编程和数学基准测试中取得最高分,同时比GPT-5.4完成相同任务所需token更少;但独立测试显示其存在明显的幻觉问题。Pro版本针对高精度工作优化,适用于高强度推理负载。

资讯摘要

OpenAI发布了GPT-5.5,称其为一种‘新型智能’,可跨代码编辑器、网络浏览器和电子表格等多种工具自主完成任务。它在编程和数学基准测试中超越了Claude Opus 4.7和Gemini 3.1 Pro,但并非所有领域都领先。GPT-5.5及其Pro版本现已通过API提供,支持一百万token上下文窗口。

尽管API价格翻倍,但由于每项任务所需的token减少,实际成本有所下降。OpenAI还指出,GPT-5.5通过分析流量模式优化了自身基础设施,改进了负载均衡,使token生成速度提升超过20%。

OpenAI发布GPT-5.5,以双倍API价格提供代理型智能能力

资讯正文

OpenAI发布GPT-5.5,称其为‘全新类别的智能’,API价格翻倍

要点

- OpenAI发布了GPT-5.5,这是一种基于代理的模型,能够自主处理复杂任务,如编写代码、执行在线搜索和跨多个工具分析数据。

- 该模型在关键基准测试中击败了竞争对手,包括Anthropic的Claude Opus 4.7和Google的Gemini 3.1 Pro,特别是在编程和高级数学方面表现优异,同时保持了速度优势,尽管并非所有领域都排名第一。

- 更强大的GPT-5.5 Pro版本也已推出,作为迭代研究伙伴,两个模型现在对付费ChatGPT和Codex用户开放,涵盖Plus、Pro、Business和Enterprise计划;API访问即将上线,但价格是之前的两倍。

更新——

- 增加了API可用性信息

2026年4月25日更新:

GPT-5.5和GPT-5.5 Pro现已通过OpenAI的Responses和Chat Completions API提供,每个模型支持一百万token的上下文窗口。OpenAI表示:“使用GPT-5.5构建的代理可以规划、收集上下文、调用工具、从模糊状态中恢复,并在较少指导的情况下完成更长的工作流程。”公司称,GPT-5.5 Pro专为“更高精度工作”设计。

独立测试实验室Artificial Analysis已对GPT-5.5进行了基准测试:OpenAI的新模型以微弱优势超过Anthropic的Claude和Google的Gemini,但在幻觉问题上存在明显弱点。根据该实验室的数据,有效API成本比GPT-5.4高出约20%——虽然纸面上的token价格翻倍,但每项任务使用的token减少,部分抵消了这一涨幅。

原始文章发布于2026年4月23日:

OpenAI宣布推出GPT-5.5,这是一种旨在跨多种工具自主处理复杂任务的代理模型。从纸面价格来看,其API费用翻了一倍。

OpenAI发布了GPT-5.5,称其为‘适用于实际工作的新型智能,可驱动代理’。公司表示,该模型旨在理解复杂目标、使用工具、验证自身输出,并独立完成任务直至结束。目前该模型已向付费ChatGPT和Codex用户开放。

代理工作流是主要卖点

据OpenAI介绍,GPT-5.5特别擅长编写和调试代码、网络研究、数据分析、创建文档和电子表格以及操作软件。该模型能自主切换不同工具,直到任务完成。

OpenAI认为,GPT-5.5在四个领域取得最大进步:代理编程、计算机使用、知识型工作和早期科学研究。这些领域需要跨情境推理能力以及长时间持续执行动作的能力。

OpenAI表示,GPT-5.5实现了这些性能提升,同时不牺牲速度。据报道,该模型的每token延迟与GPT-5.4相当,且完成相同Codex任务时使用的token显著减少。

OpenAI的GPT-5.5基准对比图。GPT-5.5 Pro仅在部分基准上进行了测试。 | 表格:OpenAI

GPT-5.5在GDPval这一衡量44个职业实际任务表现的基准测试中几乎没有提升。GPT-5.5得分为84.9%,仅比GPT-5.4的83.0%略有进步。所有基准测试的完整详情可在此处查看。

该模型与NVIDIA GB200和GB300-NVL72系统共同开发并优化。OpenAI表示,GPT-5.5和Codex实际上帮助优化了公司自身的服务基础设施——Codex分析了生产流量模式,并编写了自己的负载均衡启发式算法,使令牌生成速度提升了超过20%。“这个模型帮助改进了为其提供服务的基础架构,”OpenAI写道。

GPT-5.5 Pro旨在成为“研究伙伴”

除了标准版本外,OpenAI还推出了GPT-5.5 Pro。该公司称,全栈推理性能的改进使得这款更强大的模型更适合高负载任务。早期测试者将其称为迭代式的“研究伙伴”,当提供来自文档和插件的丰富上下文时表现最佳。

截至目前,OpenAI仅分享了GPT-5.5 Pro在九项测试中的三项结果:BrowseComp、FrontierMath Tier 1-3以及FrontierMath Tier 4。它在这三项测试中均优于基础模型。

网络安全能力被评为“高”级别

同时,OpenAI正在推出更严格的潜在网络风险分类器,这可能导致初期出现更多拒绝请求。Trusted Access for Cyber项目将为经验证的安全研究人员提供扩展的网络安全功能访问权限。OpenAI还在与政府合作伙伴合作保护关键基础设施。带有更多安全细节的系统卡片可在此处查看。

付费用户优先获得访问权;API定价是GPT-5.4的两倍

对于API,OpenAI目前定价为每百万输入token 5美元,每百万输出token 30美元,上下文窗口为一百万token,正好是GPT-5.4价格(分别为2.50美元和15美元)的两倍。GPT-5.5 Pro的定价则为每百万输入token 30美元,每百万输出token 180美元。

OpenAI认为,尽管价格更高,但GPT-5.5效率更高,在完成类似任务时所需token更少。目前尚不清楚免费用户何时能获得访问权限。至于API,OpenAI表示将“很快”上线。

来源与参考

  1. 原始链接
  2. OpenAI unveils GPT-5.5, claims a "new class of intelligence" at double the API price

收录于 2026-04-26