news 2026/4/15 10:59:31

OpenAI 急了?GPT Image 1.5 强行发布,实测惨遭「大香蕉」吊打

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenAI 急了?GPT Image 1.5 强行发布,实测惨遭「大香蕉」吊打

OpenAI 急了。

上周刚发布GPT-5.2,这周就来了图像模型。

几小时前,OpenAI 发布了GPT Image 1.5GPT Image 1的升级版。

借用官方的说法,新模型速度提升 4 倍,编辑更精准,API 价格还降了 20%。

但是,先别高兴太早。

从新模型的命名就能看出,它大概率还是个过渡模型。

如果真的提升很大,那何不直接叫GPT Image 2

谷歌从小香蕉(Nano Banana)到大香蕉,那可是直接升级成了Nano Banana Pro

而我后面的实测也证实了这个推测。


01|更新了什么?

核心改进:「精准编辑」。

你让它改哪里,它就改哪里,其他地方保持不变。

这是之前 AI 编辑图片最头疼的问题。

GPT Image 1.5号称解决了它。

光线、构图、人脸特征,都能在多轮编辑中保持一致。

速度也快了不少。

官方说是 4 倍。

实测确实如此,主要是那个旧版模型太慢了,动不动就 1 分钟才画出来。

文字渲染也有明显进步。

GPT Image 1的文字能力只能说是一般。

今天的GPT Image 1.5好了不少。

来自 OpenAI 官方的一个案例。

让模型生成一份报纸版式,里面是完整的 Markdown 表格和多段落文章。

字是清晰可读的。


02|怎么用这个新模型?

打开 ChatGPT,现在侧边栏多了一个「Images」入口。

点进去就是专门的画图空间,有预设滤镜和热门提示词,不用自己想提示词。

产品力这一块,OpenAI 没得说。

模型已经在全量推送,免费用户也能用。

不需要切换,系统默认就是GPT Image 1.5


03|和大香蕉比怎么样?

这是你们最关心的问题。

GPT Image 1.5Nano Banana Pro,到底谁更强?

先说结论:Nano Banana Pro,YYDS。

尤其是中文文字渲染,差距明显。

但 OpenAI 这次在精准编辑和指令遵循上确实追上来了。

文字渲染也还可以,仅限英文。

来实测。

A seamless, high-definition editorial quote card. Subject: A hyper-realistic portrait of {argument name="author" default="Steve Jobs"} on the left. The image is rendered in flawless native 4k resolution, with razor-sharp focus on the eyes and facial textures. His figure and black turtleneck smoothly fade into the dark brown background using a soft gradient. Atmosphere: Sophisticated deep espresso brown texture, warm premium lighting. Text Layout: On the open negative space to the right, display the quote "{argument name="famous_quote" default="Stay Hungry, Stay Foolish"}" in an elegant Light-Gold Serif font. Place the signature "—{argument name="author" default="Steve Jobs"}" below it. Decor: A single, massive, semi-transparent opening quotation mark ( “ ) is placed artistically in the background behind the text. It has low opacity, appearing as a subtle watermark that blends into the brown background.

GPT Image 1.5生成的效果如下。

整体还不错,背景质感挺好。

作为对比,这是我之前用 Lovart 里的Nano Banana Pro生成的。

接下来测试编辑能力。

把图中的 “Stay Hungry, Stay Foolish” 改成“求知若饥,虚心若愚”。

差距这就来了。

GPT Image 1.5的指令遵循没有太大问题。

但中文文字的渲染,一塌糊涂。

除了前面 3 个字,后面全是乱码。

Nano Banana Pro的结果。

继续。

把乔帮主的头偏移一个合适的角度,不需要正对。

GPT Image 1.5画的,只能说,略显僵硬。

来看Nano Banana Pro的。

你更喜欢哪个?


04|年底大战

最近是 AI 圈的密集发布期,堪比过年。

谷歌率先推出Gemini 3 ProNano Banana Pro

OpenAI 立即反击,发布GPT-5.2GPT Image 1.5

Anthropic 也没闲着,据说圣诞节前会推出Claude Sonnet 4.7

另外,本周应该还有个小惊喜,谷歌的Gemini 3 Flash

代言人 Logan Kilpatrick 昨天已经开始预热:⚡️⚡️⚡️。

期待一波。


我是木易,一个专注 AI 领域的技术产品经理,国内 Top2 本科 + 美国 Top10 CS 硕士。

相信 AI 是普通人的“外挂”,致力于分享 AI 全维度知识。这里有最新的 AI 科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用 AI 为你的未来加速。


精选推荐

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/13 12:29:51

EmotiVoice在语音社交App中的角色语音解决方案

EmotiVoice在语音社交App中的角色语音解决方案 在如今的语音社交应用中,用户早已不再满足于“机器朗读”式的冰冷回应。他们希望听到的是有温度、有情绪、像真人一样的声音——尤其是在虚拟恋人、AI陪聊、剧情互动等高度依赖情感共鸣的场景下,语音的表现…

作者头像 李华
网站建设 2026/4/14 8:52:42

从GitHub星标破万看EmotiVoice为何火爆出圈

从GitHub星标破万看EmotiVoice为何火爆出圈 在AI语音技术逐渐渗透到日常生活的今天,我们早已不满足于“机器朗读”式的冰冷输出。无论是智能助手、虚拟偶像,还是有声书和游戏NPC,用户期待的是更自然、更有情感的表达——一种真正“像人”的声…

作者头像 李华
网站建设 2026/4/14 7:35:18

EmotiVoice能否支持长文本自动断句合成?实测来了

EmotiVoice能否支持长文本自动断句合成?实测来了 在内容创作自动化浪潮席卷各行各业的今天,AI语音技术早已不再是“能说话”那么简单。从有声书到短视频配音,从虚拟主播到无障碍阅读,用户期待的是自然、富有情感、连贯流畅的语音输…

作者头像 李华