OpenAI将Codex转变为持续运行的编码代理
The Decoder··作者 Matthias Bastian
关键信息
该功能目前仅限macOS用户使用,部分功能受地区限制;上下文感知建议和记忆功能将在未来面向企业、教育、欧盟和英国用户推出。Codex现在可以同时运行多个终端标签页,并可通过SSH连接远程开发环境(Alpha版)。
资讯摘要
OpenAI显著增强了其Codex AI编码助手,引入了“后台电脑使用”功能,使其能够通过观察、点击和输入来与用户的Mac应用程序交互。这使得Codex可以在数天甚至数周内完成长期项目,成为真正的自主代理。更新还增加了内置浏览器用于评论网页、使用gpt-image-1.5生成图像,并新增了90多个插件,支持JIRA、GitLab、微软套件和Slack等集成。
Codex现在可以编辑GitHub评论、运行多个终端窗口,甚至在无人干预的情况下唤醒继续任务。这些能力使Codex成为Anthropic Claude Code的直接竞争对手,并标志着AI代理向处理整个软件开发生命周期迈进的重要一步。

资讯正文
OpenAI将Codex转变为一个始终在线的编码代理,能够监视你的屏幕
要点
- OpenAI已大幅扩展其开发者工具Codex,新增了“后台计算机使用”功能,使AI能直接看到屏幕、点击和输入文字。
- Codex现在可以为自己安排未来任务,并自动继续处理长期项目,据称可跨越数天甚至数周,使其成为更自主的编码助手。
- 此次更新还包含一个集成浏览器,可用于直接在网站上评论;通过gpt-image-1.5生成图像;以及超过90个新插件,支持JIRA、GitLab、Microsoft套件和Slack等工具。
OpenAI正在大规模扩展其开发者工具Codex:该AI现在可以独立控制Mac电脑,生成图像,记住偏好设置,并在数周内持续自主完成任务。此举直接瞄准Anthropic的Claude Code。
OpenAI发布了Codex的全面更新,使这款AI编码助手远超此前作为终端和编辑器工具的角色。最大新功能是“后台计算机使用”:根据OpenAI的说法,Codex现在可以通过观察屏幕、点击和输入文字来操作用户电脑上的任意应用程序。
多个代理可以在Mac上并行运行,且不会干扰用户在其他应用中的操作。OpenAI表示,这特别适用于开发人员迭代前端更改、测试应用程序或处理没有API的程序。目前该功能仅限于macOS系统。
Codex应用现在还内置了一个浏览器,用户可以直接在网页上留言,向代理提供具体指令。现阶段,这主要面向前端和游戏开发。OpenAI计划进一步扩展浏览器功能,使Codex不仅能控制本地网页应用,还能完全掌控浏览器。
Codex成长为完整的软件开发伙伴
此次更新还大幅扩展了软件开发工作流程的支持范围。例如,Codex现在可以编辑GitHub评审评论,同时运行多个终端标签页,并通过SSH连接远程开发环境(Alpha阶段)。
OpenAI也增强了自动化能力:现有的对话线程可以被重复使用,先前建立的上下文得以延续。Codex可以为未来的任务安排自己,并在需要时自行唤醒,继续处理长期项目,“可能跨越数天或数周”,OpenAI表示。
团队可以利用这些自动化功能处理从处理开放拉取请求到跟踪任务,再到监控Slack、Gmail和Notion中的对话等各种事项。
图像生成与90多个新插件
Codex现在使用gpt-image-1.5进行图像生成。结合截图和代码,这让团队能够在同一工作流中创建和迭代产品概念、前端设计、原型图和游戏图形。
OpenAI 还发布了超过 90 个额外插件,这些插件整合了技能、应用集成和 MCP 服务器。新增插件包括用于 JIRA 管理的 Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft 套件、Databricks 的 Neon、Remotion、Render 和 Superpowers。这些插件让 Codex 能够从不同工具中获取更多上下文信息,并直接对其进行操作。
更新现已开始推送,但部分功能目前受地区限制。
这些更新已立即面向使用 ChatGPT 账户登录的 Codex 桌面应用用户推出。个性化功能如上下文感知建议和记忆功能将很快面向企业版、教育版、欧盟和英国用户推出。当前电脑使用功能仅限于 macOS 系统,后续将扩展至欧盟和英国用户。
无夸大报道的 AI 新闻——由人类精选
来源与参考
收录于 2026-04-17