OpenAI最新生图模型实测，网友：完蛋了

OpenAI的Nano Banana Pro平替，来了？,智东西12月17日报道，今天，OpenAI推出了其新一代图像模型
GPT Image 1.5。这一代模型具备更强的指令遵循，更精准的图像编辑，也能较好的保留细节，生成速度则来到
上一代模型的4倍。,,OpenAI官方在宣传片中集中展示了模型能力，可以看到，GPT Image 1.5将图中人物准确地融入了太空、雨林等不同背景，还在手绘、毛毡等不同风格间保持了人物一致性。,与此同时，OpenAI还在ChatGPT中推出了
独立的图像生成板块，提供各种模板、风格，让创作更为便捷,,这些更新解锁了不少新玩法。OpenAI创始人兼CEO Sam Altman晒出了自己用GPT Image 1.5打造的“消防员写真年历”。,,不过，有网友发现图中的日历根本不准，还有好多网友劝Altman赶紧把这有点辣眼睛的照片删了。ChatGPT的官方账号实在忍不住，直接用GPT Image 1.5给Altman穿上了T恤衫。,,OpenAI官方暂时没有公布任何基准测试，不过在权威大模型测评网站Artificial Analysis上，GPT Image 1.5
登顶文生图和图像编辑两大榜单，均超越了谷歌的Nano Banana Pro。,,在LMArena大模型竞技场上，GPT Image 1.5同样
霸榜文生图和图像编辑两大榜单。,,GPT Image 1.5按token定价，价格取决于分辨率和质量设置。高质量一百万像素图像的价格约为
每千张133美元（约合人民币937元），低质量
每千张9美元（约合人民币63元）。所有ChatGPT用户今天都能用上这款模型，其API也已经同步推出。,GPT Image 1.5的技术实力究竟如何？发布后，已有不少网友对比了GPT Image 1.5与Nano Banana Pro的生成效果，智东西也对两款模型的能力进行了体验。,我们的感受与许多网友类似：虽然GPT Image 1.5是一款不错的图像生成模型，但它在真实度和细节准确度上，似乎仍与Nano Banana Pro存在明显可感的差距。,首先来看看GPT Image 1.5的文生图能力。我们的第一则提示词考察了模型在复杂场景和多主体关系下的表现：,在生成速度上，Nano Banana Pro更胜一筹，耗时大概15秒完成输出，这包括其思考的过程。可以看到，Nano Banana Pro对复杂提示词中的细节做到了准确还原，不过没有理解“发光的全息伞”这一细节。画面中，出租车和街道的细节都做到了准确的还原。,,随后GPT Image 1.5也给出了生成结果，第一眼我们就能感受到明显的“AI味儿”。
GPT Image 1.5的画风十分“油腻”，饱和度拉得很高。对于我们明确要求的“车窗内可见司机的侧脸”，GPT Image 1.5做了模糊化处理。人物和背景的融合也并不自然，给人一种处于两个图层的感觉。,,如果仔细看，还能发现图中角色右手只有四个手指，这种基础的人体错误对一款2025年的生图模型来说，实在有点不应该了。,接下来的提示词，主要考察模型在风格迁移和语义约束方面的表现：,GPT Image 1.5的生成依旧还是慢了半拍，不过这次我们先来看看其效果：虽然画面内容基本准确，但在最关键的强烈旋涡状笔触和色彩风格上，可以说是差强人意，与梵高《星空》原作的区别十分明显。,,Nano Banana Pro的生成结果如下。可以看到，在保证细节准确的前提下，模型准确还原了梵高《星空》的画风，色彩风格也更为接近原作。,,这则提示词主要考察细节一致性，画面的视角也是非常规视角，能体现模型在边缘场景的能力：,GPT Image 1.5在这种边缘场景出现了很严重的崩坏。首先，猫只有半张脸长了胡子，鼻子等细节全部丢失了，让人一时无法辨认这是猫脸还是一个小毛球。此外，对背景的虚化其实让图像的真实感更差了。,,Nano Banana Pro的生成结果如下，凭画面能一眼判断这是我们要求的猫猫第一视角，光影还原度和细节呈现也符合我们的要求。,,也有不少网友分享了对比实测的效果。同样为人物肖像，左侧由GPT Image 1.5生成的画面中，人物的头部过大，光影效果的日常感要差一些。Nano Banana Pro的生成结果虽然面部打光有点不足，窗子有点过曝，不过正是这种瑕疵让图像的真实感更好。,,分享这一生成结果的网友称：
OpenAI彻底完蛋了。,,不过，也有网友补充道，如果在发给GPT Image 1.5提示词里加入“未经处理的iPhone照片”、“低饱和度颜色配置文件”等要求，就能让其效果更为真实。,,AI博主Heisenberg分享了最近很火的巨人特效，他认为，相比之下，Nano Banana Pro的结果要自然得多。在细节方面，GPT Image 1.5出现了许多Bug，比如
左侧两辆汽车直接面对面行驶，道路上的白线断断续续，Altman的手也显得过大了。,,我们还测试了GPT Image 1.5生成中文的能力。在前几个字模型还保持了相对的准确度，但在之后就出现了诸多错误。,,目前，GPT Image 1.5一天内提供大约5次的免费试用机会，在图像编辑任务上，我们未能进行实测。不过，OpenAI在其官方博客中分享了不少案例。,GPT Image 1.5支持多元素融合，比如下图就把OpenAI的两位高管和一只狗融合到了同一画面里，提示词要求显示出他们在生日派对上觉得很无聊，画风限定为2000年代的胶片风。不过，对于胶片风的还原，这一画面做得并不到位。,,下图则体现了GPT Image 1.5在元素替换方面的表现，提示词要求把左图人物的上衣变成红色，帽子变成黄色，限速改为15，卡车变成消防车，这些都得到了不错的还原。,,GPT Image 1.5还支持多样的风格迁移，有些风格只要使用预设的模板就行。,比如，可以把OpenAI的发布会，打造成老派黄金时代好莱坞电影海报风格。,,把Altman的证件照变成80年代VHS健身教练风格。,,或是把Altman放进2000年娃娃游戏的换装界面，所有环境都是粉色的。,,综合来看，在Nano Banana系列模型已经拉高用户预期的前提下，GPT Image 1.5并不是一次颠覆式的飞跃。它在指令遵循、多元素编辑、风格模板化和产品化体验上，确实体现了OpenAI一贯擅长的产品思维。尤其是深度融入ChatGPT并推出独立板块之后，图像生成的门槛被进一步拉低，创作流程也更加顺滑。,但从纯模型能力层面来看，GPT Image 1.5与Nano Banana Pro之间仍然存在肉眼可见的差距：真实感不足、细节稳定性偏弱、人体结构和复杂视角下的失误，都会在高要求场景中被迅速放大。GPT Image 1.5能否获得市场认可，仍有待观察。,本文来自微信公众号
“智东西”（ID：zhidxcom），作者：陈骏达，编辑：漠影，36氪经授权发布。,该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。