ChatGPT 图像 2.0：文本准确图形生成的重大飞跃

ZDNET AI·4月24日 21:19 UTC·作者 David Gewirtz

关键信息

该模型在用户直接将参考图像（如 ZDNET 徽标）加入提示时表现最佳；尽管文本准确性大幅提升，但仍偶尔出现徽标错位或小错误，需要人工审核。

资讯摘要

大卫·盖维茨使用付费的 ChatGPT Plus 账户（开启思维模式）对 ChatGPT 图像 2.0 进行了广泛测试。他发现该工具在生成带有正确文字和品牌一致性的详细信息图和草图笔记方面表现出色，例如能准确重现 ZDNET 徽标和风格。然而，仍存在一些错误——比如徽标位置不正确或轻微事实错误——表明虽然功能强大，但专业使用中仍需人工审核。

该模型还展示了改进的推理能力，能添加原始文章中没有的相关数据。总体而言，这是让 AI 生成图像适用于实际应用的一大进步。

资讯正文

我试用了ChatGPT Images 2.0：有趣且显著的进步——意外地对实际工作很有用

Follow ZDNET: Add us as a preferred source on Google. ZDNET's key takeaways Images 2.0 delivers accurate text and usable graphics. It can match brand styles, including ZDNET visuals. Errors still slip in, requiring human review.

本周早些时候，OpenAI发布了ChatGPT Images 2.0，这是其全新的图像生成引擎。这次发布的关键在于功能上的飞跃：从生成“装饰性”图像（OpenAI的说法）转变为创建包含详细文字的完整页面图形。我提前获得了预发布版本的测试权限，它表现相当不错，但始终无法正确识别ZDNET的标志。现在产品已正式上线，我决定在各种挑战场景下进行深入测试。

Images 2.0对所有ChatGPT用户开放，但更强大的语言功能仅限于付费用户（可使用Thinking模型）。我使用的是开启Thinking模式的ChatGPT Plus账户完成所有测试。

让我们从ZDNET品牌标识的练习开始。我没有直接上传ZDNET网页让系统自动识别logo，而是单独创建了一张ZDNET标志图片，并将它与每条提示一起上传。这似乎极大地提升了效果。

[一个快速说明：ZDNET不允许OpenAI抓取其网页内容。Ziff Davis（ZDNET母公司）已于2025年4月起诉OpenAI，指控其在训练和运行AI系统时侵犯了Ziff Davis的版权。因此，我使用Chrome扩展程序截取了想要测试的文章全屏截图，这样ChatGPT才能读取它们。]

Images 2.0能否保留ZDNET标志？我的起点是之前关于Images 2.0的文章。我给ChatGPT输入如下提示：“使用ZDNET品牌风格和附带的ZDNET标志，为这篇文章创建一张详细生动的信息图。” 不仅标志准确无误，配色也完美契合ZDNET的调性。但真正出彩的是它的文字处理能力：所有文字都正确，包括图片中倾斜的小字号文本。

它能否生成有设计感的笔记草图？接下来，我决定重新尝试几个月前给Google Nano Banana布置过的笔记草图任务。当时的要求是把美国《权利法案》制作成笔记草图。Nano Banana在图像方面做得很好，但我不得不反复尝试才能让它准确呈现文字内容。阅读原文可以看到我当时经历了怎样的折腾。

对于ChatGPT Images 2.0，我略微提高了难度。我不仅希望获得笔记草图，还希望它们符合ZDNET的品牌风格。我在整篇文章中强调品牌风格，因为这正是ChatGPT Images 2.0能为用户带来真实价值的一种方式。

第一个提示如下：“为美国《权利法案》制作一张笔记草图，使用ZDNET标志风格，并按ZDNET风格呈现。” 这是左侧的图像。

第二个提示是：“加入ZDNET标志，并添加更多霓虹风格的颜色，背景可以是黑色。” 这是右侧的图像。

首先请注意，文字完全正确。

我尝试了ChatGPT Images 2.0：有趣且进步显著——意外地对实际工作也很有用

没有重复内容，也没有缺失。仅此一点，它就已经远远超过Nano Banana的表现。两个版本都符合ZDNET的风格。唯一让我不太满意的是，第二张图中ZDNET的logo看起来挤在画面里了。不过logo本身是正确的，我可能再试几次提示词就能让它位置更好。

但接下来出现了一个非必要的错误，我在测试集里发现了这个问题。我让Images 2.0把我的AI网站构建工具评测文章转成信息图，结果生成了一个还算可用、只是略显拥挤的信息图。它甚至联网补充了文章中没有提到的信息，比如基础定价。但明显存在四个错误：

标题强调的是“这里有9个最佳AI网站构建工具”，还特意突出了数字“9”。但实际上只有五个工具被评测过。信息图下方明确列出了我评测的那五个工具。哎呀。

我评测的服务分别是Hostinger、GoDaddy、Wix、10Web和Squarespace。ChatGPT不知为何把10Web换成了Durable（10Web的一个竞争对手）。我根本没有评测过Durable，也没提过它。太离谱了。

AI还为这些服务生成了一个总结表格，列出了易用性、设计灵活性和AI功能的星级评分。但我根本没提供这些类别的评分。AI对某些厂商过于慷慨，这与我的评测文字直接矛盾。很奇怪。

最后，虽然这只是个小问题，但还是值得一提：在信息图底部，AI正确还原了ZDNET的logo，但在它上方有一条下垂的线条。为什么？

目前来看，最好的AI图像生成器只有一个明确的赢家。

公平地说，这些错误即使是内部的人工设计师在初稿中也可能犯。在我担任创始人和产品经理的多年经验中，我也见过设计师提交的第一稿出现更严重的图形错误。当我用修正后的提示词重新提问Images 2.0（除了星评部分我没有在第二张图中修改），它确实能正确调整信息图，加入更合适的内容。

ChatGPT Images已经取得了巨大进步。

这次发布的Images 2.0版本相比之前版本有了巨大提升。去年我看过旧版ChatGPT Images，它在重构图像方面已经令人印象深刻。另外：我提前体验了ChatGPT Images 2.0，非常惊艳——唯一的例外是……

这个新版本能够理解真实内容并据此生成图像，相比之前的版本是一次质的飞跃。更重要的是，它可以带来切实可行的商业价值，不仅适合娱乐用途，也真正适用于日常工作。

请继续关注，我会对比这个版本与Google Gemini的Nano Banana。我还会进一步测试它能否协助其他工作相关任务，特别是用户界面设计领域。

你是否愿意依赖AI生成的视觉内容？要知道模型可能会引入细微的事实错误。欢迎在评论区告诉我们你的看法。你也可以在社交媒体上关注我日常项目更新。

我尝试了ChatGPT Images 2.0：这是一次有趣且巨大的飞跃——出人意料地对实际工作也很有用。

请订阅我的每周更新通讯，并在Twitter/X上关注我 @DavidGewirtz，在Facebook上关注 Facebook.com/DavidGewirtz，在Instagram上关注 Instagram.com/DavidGewirtz，在Bluesky上关注 @DavidGewirtz.com，以及在YouTube上关注 YouTube.com/DavidGewirtzTV。

来源与参考

收录于 2026-04-25