ChatGPT Images 2.0 强化非拉丁文字渲染能力

OpenAI 正式发布ChatGPT Images 2.0,OpenAI 将其定义为图像生成模型的跨越式升级。
2026-04-23 16:35:25  |   作者:开源爱好者  |   来源:

ChatGPT Images 2.0 强化非拉丁文字渲染能力

OpenAI 正式发布ChatGPT Images 2.0,OpenAI 将其定义为图像生成模型的跨越式升级。
2026-04-23 16:35:25
作者:开源爱好者
来源:

在推出 ChatGPT 内置图像生成功能一年多后,OpenAI 正式发布ChatGPT Images 2.0,官方称其为图像生成领域的里程碑式进步,核心提升包括指令精准遵循、密集文本清晰渲染、场景物体合理布局与关联,并首次为图像模型融入推理能力,支持联网搜索与结果自检,在需要高精度、一致性与视觉连贯性的场景中更可靠。

chatgpt-images.jpg

核心升级:多语言渲染 + 推理能力

Images 2.0 重点优化非拉丁文字生成,在中文、日语、韩语、印地语、孟加拉语上实现质的突破,字形、排版、小字清晰度显著提升,能精准还原不同视觉语言的风格特征,适配游戏原型、故事板等创作场景。

此外,模型支持超宽 3:1 至超高 1:3的任意宽高比,最高2K 分辨率输出,单次可批量生成8 张风格连贯的图像,角色与物体跨图一致性强。

实测体验:像素艺术、透明图与漫画创作

抢先实测中,模型精准还原艺术风格;包括生成透明背景 PNG,效果优于多数竞品;例如制作漫画时,画面连贯、风格统一。

测试发现,模型对复杂指令的理解更深入,但连续生成的细节一致性仍有优化空间;在自检任务中偶发 “幻觉”,可靠性待提升。

发布与竞品动态

Images 2.0即日起全量开放:免费 / 基础版用户可用基础生图功能,Plus/Pro 订阅用户解锁思考模式(联网搜索 + 推理规划);同时通过API 与 Codex 编程应用提供服务。

本轮升级紧接Anthropic推出设计助手之后,与谷歌Nano Banana 2形成直接竞争,第三方评测显示其文生图能力领先竞品 242 分,创行业新差距。