OpenAI 推出 ChatGPT 图像生成器 2.0,支持联网搜索与多图生成

The Verge AI··作者 Emma Roth

关键信息

GPT Image 2 模型支持最高 2K 分辨率、13 种长宽比(包括 3:1 和 1:3),并显著提升了日语、韩语、中文、印地语和孟加拉语等语言的文字渲染能力。

资讯摘要

OpenAI 推出了基于 GPT Image 2 模型的 ChatGPT 图像生成器 2.0,引入了联网搜索和推理功能。用户只需一个提示即可生成多达八张细节丰富且风格一致的图像,同时保持角色、物体和风格的一致性。该版本还改进了多种语言的文字生成能力,支持最高 2K 分辨率和更多长宽比选项。

此功能面向所有 ChatGPT Plus、Pro、Business 和 Enterprise 用户开放。这是继 2024 年 12 月更新后的又一重要升级,正值谷歌 Nano Banana Pro 和微软 MAI-Image-2 等竞品不断涌现之际。

OpenAI 推出 ChatGPT 图像生成器 2.0,支持联网搜索与多图生成

资讯正文

OpenAI正在推出其AI驱动图像生成器的最新版本,新增了‘思考能力’,使其能够搜索网络以帮助从单一提示中创建多张图像。周二,OpenAI宣布ChatGPT Images 2.0现在可以生成更‘复杂’的图像,改进了遵循指令的能力、保留用户选择细节的能力以及生成文字的功能。

该功能由OpenAI新推出的GPT Image 2模型提供支持,目前仅对ChatGPT Plus、Pro、Business和Enterprise订阅用户开放。当选择使用思考模型时,聊天机器人图像生成器可以从网络获取信息,基于你上传的文件创建视觉解释,并在生成图像前‘推理图像结构’。

启用思考模式后,ChatGPT Images 2.0一次最多可生成八张图像,同时保持每张场景中的角色、物体和风格一致。OpenAI表示,这将使生成漫画页面、一系列社交媒体图形或房屋每个房间的设计方案变得更加容易。

所有ChatGPT用户都可以享受更新,让ChatGPT Images 2.0更好地捕捉照片的关键特征,包括像素艺术、漫画、电影剧照以及其他类型的图像。它现在能生成最高达2K分辨率的图像,并支持更多宽高比,从更宽的格式(如3:1)到更高的竖版格式(如1:3)。此外,它不仅在生成英文和其他拉丁字母语言文本方面表现更好,OpenAI还表示Images 2.0在生成包含日语、韩语、中文、印地语和孟加拉语等文字的图像方面取得了‘显著进步’。

来源与参考

  1. 原始链接
  2. OpenAI’s updated image generator can now pull information from the web

收录于 2026-04-22