Ideogram 4.0 发布:开放权重与原生 2K
The Decoder··作者 Matthias Bastian
关键信息
Ideogram 表示,该模型可从 GitHub 下载,并可用自有数据进行微调,但商业用途需要付费许可。文章还提到,该模型可通过 Ideogram 托管 API 以三种质量档位使用,并已接入多个合作平台;在 DesignArena 榜单上,它位列开放权重模型第一。
资讯摘要
Ideogram 发布了其文本生成图像模型 4.0 版本,并以开放权重形式推出。公司表示,这一版本加入了原生 2K 分辨率、透明背景、更好的文字渲染,以及通过边界框实现的更精确布局控制。官方强调,这些能力对生成标志、海报等设计类内容特别有用。Ideogram 还表示,可编辑文字和图层功能即将上线。该模型的权重和代码可以从 GitHub 下载,并且可以在本地硬件上运行,还支持使用用户自己的数据进行微调。
不过,商业用途需要付费许可。文章援引 DesignArena 榜单称,Ideogram 4.0 在所有开放权重模型中排名第一,但在整体评分上,OpenAI 和 Google 的闭源模型仍然更高。除了 Ideogram 自己的网页和 API 之外,该模型也已接入 Hugging Face、ComfyUI、fal、Runware、Magnific、Krea AI、Leonardo AI、Picsart、Cloudflare、Replicate、Gamma、Flora AI 和 Kittl 等合作平台。文章还提到,在一个基准提示词测试中,它明显优于 Midjourney v8,大致与 Flux 持平,但仍不及 GPT-Image-2、Nano Banana Pro 或 Luma Uni-1.1。作者同时提醒,这只是单个提示词的结果,用户仍应自行测试模型表现。

资讯正文
Ideogram 4.0 作为一款开放权重模型发布,原生支持 2K 分辨率并改进了文本渲染
Ideogram 已发布其文生图模型的 4.0 版本,并以开放权重模型的形式提供。
据 Ideogram 介绍,新功能包括原生 2K 分辨率、透明背景、通过边界框实现精确布局控制,以及改进了图像中的文本渲染,这对徽标和海报很有用。公司表示,可编辑文本和图层功能也即将推出。
该模型可以在你自己的硬件上运行,并使用你自己的数据进行微调。权重和代码可在 GitHub 上下载,但商业用途需要付费许可。
根据 DesignArena 排行榜,Ideogram 4.0 在所有开放权重模型中排名第一。只有 OpenAI 和 Google 的闭源模型得分更高。在文生图赛道中,它在质量模式下也排名第一,总体排名第九。根据 Ideogram 网站的信息,该模型可通过 Ideogram 自家的托管 API 以三档质量等级提供:
Ideogram 4.0 也可在网页端和多个合作平台上使用,包括 Hugging Face、ComfyUI、fal、Runware、Magnific、Krea AI、Leonardo AI、Picsart、Cloudflare、Replicate、Gamma、Flora AI 和 Kittl。在我们的基准提示词测试中,该模型明显优于 Midjourney v8,大致与 Flux 相当,但不及 GPT-Image-2、Nano Banana Pro 或 Luma Uni-1.1。不过,这只是一个提示词测试,主要考察模型对提示词的遵循能力,以及渲染训练数据中可能不会出现的抽象概念的能力,比如骑马的宇航员。和往常一样,你自己的测试必不可少。
来源与参考
收录于 2026-06-04