
OpenAI正推出新版ChatGPT图像功能,该版本保证能更精准地遵循指令、实现更细致的编辑效果,同时图像生成速度将提高到原来的4倍。
这个新模型被命名为GPT-Image-1.5,自周二起向所有ChatGPT用户及API用户开放。这是OpenAI为与谷歌Gemini展开竞争推出的最新升级举措,而在此之前,OpenAI首席执行官Sam Altman于上月一份泄露的内部备忘录中发出了“红色警戒”。该备忘录详细阐述了在谷歌开始抢占市场份额后,OpenAI计划重新夺回AI领军地位的相关策略。谷歌此前发布了其最新旗舰模型Gemini 3,以及最新版本的爆款图像生成器Nano Banana Pro——这两款产品在LMArena排行榜的多项基准测试中均位居前列。
尽管OpenAI在上周推出了GPT-5.2作为应对举措,谷歌依旧占据领先位置,并宣称其模型是目前最先进的,可满足开发者与日常专业场景的使用需求。有消息称,OpenAI原本打算在一月初推出一款新的图像生成工具,不过由于本周的公告,他们加快了这一计划的推进。该公司上一次发布图像模型是在四月份的GPT-Image-1。
随着图像与视频生成工具逐步脱离原型阶段、具备更强的生产级应用能力,GPT-Image-1.5正式推出。和Nano Banana Pro类似,ChatGPT图像功能配备了后期制作特性,能够提供更精细的编辑操控,从而在面部特征匹配、光影效果、画面构图及色彩氛围等方面维持视觉表现的一致性。

目前多数生成式AI图像工具在迭代优化上存在短板,所以若能改善这一点将是重大突破。当用户提出诸如“调整面部表情”“让光线更冷”这类具体修改需求时,现有模型往往会对图像整体进行重新生成,难以保持前后内容的一致性。
更新的意义不止于增添新功能。如今,ChatGPT图像功能可通过ChatGPT侧边栏里的专属入口进入,这个入口“更像是一间创意工作室”,OpenAI的应用首席执行官Fidji Simo在周二发布的一篇博客文章中如此表示。
“全新的图像查看与编辑界面,让你更轻松地创作出契合自身构想的图像,或是从热门提示词与预设滤镜里汲取灵感,”Simo 如是写道。
除了新的图像生成器,OpenAI还推出了新方法来优化ChatGPT的使用体验,增添更多视觉元素。据Simo介绍,他们计划让搜索查询呈现出更多带有明确来源的视觉内容,这或许会对转换度量单位、查看体育比分这类任务有所助益。
Simo写道:“在创作过程中,你应当能清晰感知并雕琢手中的作品。当视觉元素比单纯的文字更能传递故事内核时,ChatGPT就该将其纳入其中;当你需要快速获取答案,或是要在其他工具中推进下一步操作时,它也应随时待命。通过这样的方式,我们能持续拉近你脑海中的创意与将其落地实现之间的距离。”
《桃源记2》中石作的建造方式
发布时间:2025-11-26
《英雄联盟手游》5.3d版本更新内容全知晓
发布时间:2025-11-27
《央视影音》把视频保存至手机相册的方法汇总
发布时间:2025-11-27
《原神》中罗莎莉亚圣遗物词条的搭配攻略
发布时间:2025-11-28
《英雄冒险团》战士属性加点攻略分享
发布时间:2025-11-28
《画世界》中向下合并图层的操作方法
发布时间:2025-11-29
第五人格毛利小五郎皮肤好不好?来看第五人格毛利小五郎皮肤介绍
发布时间:2025-11-29
《羊了个羊12月23日通关攻略,12.23过关技巧大揭秘》
发布时间:2025-11-30