ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

OpenAI新图像模型超越谷歌登顶

时间:2026-04-23 03:57:58来源:第一财经编辑:快讯

“GPT images 2终结了比赛”“强得有点离谱了”“设计行业要变天了”。北京时间4月22日,OpenAI发布了新的图像生成模型ChatGPT Images 2,生图能力被认为跨越了一个大的台阶。不少网友实测后感慨,现实与AI生图的界限更难分清了。

今天凌晨,OpenAI CEO 奥尔特曼(Sam Altman )带队开启了一场 20 多分钟的线上直播,直播中提到Images 2 是公司迄今为止功能最强大的图像生成模型。“Images 2是一个巨大的飞跃,就像从 GPT-3 一步跳到了 GPT-5。”奥尔特曼说。

从评测基准来看,Images 2确实表现出色。海外大模型评测机构Arena.ai发布帖子表示,OpenAI 的 GPT-Image-2 已登顶所有 Image Arena 排行榜第一,并在文生图领域以创纪录的 242 分优势领先第二名的谷歌Nano-banana-2。

“这是迄今为止见过的最大差距,此前没有任何模型能在 Image Arena 以如此大的优势主导。”Arena.ai表示。

从第一财经记者的实测以及各方反馈来看,这次的提升确实不小。

记者让Images 2生成一张《第一财经》杂志的封面,封面图片是20年后的上海城市面貌,需要包含东方明珠和黄浦江,等待了大概20秒生成了一张图。

此前记者曾用该封面的需求测试过多个图像模型,但所有模型都无法将中文字体输出正确,但Images 2一次生成就基本做到了,无论是大的文字还是更小的字体,一眼看过去没有明显的问题。这仅仅是免费版本的效果。

如果要挑细节,放大图像仍会有一些不真实的地方,例如图像底部小字体的“浪潮”“趋势”笔画会有一些不标准。图像右边缘有半个人似乎站在水里。在日期上,图像给出的是2024年也就是两年前。但总体来看,这确实是一个表现出色的模型。

“这是我在过去4个月里一直在准备的东西。”OpenAI研究科学家陈博远今天也发帖表示,GPT Images 2有着巨大的飞跃。它在精准听懂长指令、准确摆放并理清物体间关系、渲染密集文本方面有了巨大突破。

官方博客还展示了一张陈博远亲自制作并出镜的案例图,他写了提示词一次性生成了一整页全中文彩色漫画,内容是他在OpenAI做Image 2中文文本渲染优化的故事,提到了家乡无锡的热门玩法,还加入了时下热门的“稳稳地接住你”的AI语言梗。

这张图同时展示了中文文本渲染能力的突破、极小字号的精度控制、以及复杂多面板漫画的一次性生成能力。

除了文字渲染,在真实图像生成中,Image 2也被认为拥有出色的构图能力和视觉美感,使得最终效果看起来不像AI生成,而更像是精心设计的作品。

Images 2也是OpenAI首个具备思考能力的图像模型。在 ChatGPT 中选择思考型或专业型模型后,Images 2 可以搜索网络获取实时信息,根据一个提示创建多个不同的图像,并对其输出结果进行双重检查。OpenAI称,凭借思考能力,该模型可以承担从构思到图像生成的更多繁重工作,尤其是在准确性、信息时效性、一致性和视觉连贯性至关重要的情况下。

Canva创意策略师表示,“最让我们感到惊喜的是 GPT Image 2 添加的细节。它引入了一些我们之前没有考虑到的元素,比如TikTok 爆款贴纸,这是一个巧妙的创意选择,旨在制造话题热度。这个模型不仅仅是渲染图像,它还能解读简报、了解受众,并在幕后做出创意决策。”

不少业内人士拿新模型与谷歌的Nano-banana-2做对比,大多数情况下Images 2在构图、人物背景的真实感会更佳,但是在光线渲染上谷歌仍然会更好。

在博客最后,OpenAI也承认Images 2并非完美无缺。例如它仍然难以处理需要完整且连贯的物理世界模型、折纸指南、魔方等谜题,以及需要在隐藏、倾斜或反转表面上正确显示的细节。像细沙粒这样非常密集或重复的视觉细节也可能超出模型的处理能力。这些局限性是未来工作的重要方向。

不过,从当前的反馈来看,Images 2已经重新定义了AI图像生成的顶尖水平,人人都是设计师的时代或许更快到来了,“这件事对内容行业、设计协作、信息表达都会有影响。”

更多热门内容
快手2025年社会责任报告:AI赋能就业,催生15个新职业助力创作者发展
这并非科幻场景,而是AIGC(人工智能生成内容)创作者的日常。 据介绍,快手催生的AI新职业涵盖AIGC应用师、提示词工程师、AI导演、人工智能训练师等多个方向。快手自研视频生成大模型可灵AI,截至2025年…

2026-06-03

一加Turbo 6X系列新机6月来袭:高刷屏配8K大电池,性能续航双升级
一加与OPPO已合并数年,双品牌共同发展,OPPO倾向于影像方面,一加倾向于游戏方面,各有优势。 需要专业级影像的,自然是合并的OPPOFind X9系列更适合,拥有旗舰配置+专业影像,而且有哈苏影像加持,…

2026-06-03

小米YU7闪耀C-ICAP智能评测:辅助驾驶到隐私保护全项满分领航
快科技6月2日消息,中汽中心C-ICAP智能网联测评结果正式公布,小米YU7拿下规程里的最高评级,在辅助驾驶、泊车、智能座舱、隐私保护几个项目全部拿到顶尖评分。自动泊车适配窄车位、斜列车位等多种场景,不用人为…

2026-06-03

从百万到十万:中国机器人价格风暴来袭,具身智能“苹果时刻”已至?
中国在新能源汽车上砸出的万亿级重资产和完善的制造业生态,构成了今天对全球机器人市场的“降维打击”。 美国硅谷走的是“大脑优先”路线,依靠OpenAI等大模型的突破赋能机器人;而中国企业则走出了极具本土特色的…

2026-06-03

科技新伙伴:仿生人形机器人走进生活,开启文旅与日常新篇章
张挺昊介绍,以“小琪”为代表的女性形象机器人和历史名人机器人是EX机器人公司目前主推的两大类仿生机器人产品,可以根据用户需要开展定制化服务,实现仿生人形机器人在更多场景中的落地应用。 张挺昊说:“我们已经找到…

2026-06-03

DuckDuckGo响应需求推新举措:为Chrome和火狐浏览器上线无AI搜索插件
IT之家 6 月 2 日消息,谷歌此前在 I/O 大会上宣布将对搜索引擎进行“全面 AI 化改造”,引发传统派用户反感,进而导致DuckDuckGo 的无 AI 搜索页面(noai.duckduckgo.c…

2026-06-03

AI“影棚”时代来临:GPT Image 2等工具让形象照生成变得触手可及
打个不太恰当的比方:像素蛋糕等 AI 修图模式,本质上是在「照片上涂改」;而 AI 生图的模式,本质上是你向 AI「形容」照片里的人,再让AI 大模型重新画出新的图片。 在雷科技看来,从技术的角度来说,用…

2026-06-03

时隔五年重返市场:七彩虹RTX 3060 12G显卡全国铺货 批发价2199元填补供应缺口
此前在 2026 年 5 月初,市场便有消息称英伟达计划于 6 月恢复 RTX 3060 12GB系列芯片的生产,并将其分配给七彩虹、华硕、微星、影驰等主要 AIC 厂商,预计 7 月起陆续上市。 七彩虹…

2026-06-03

小米YU7智能评测大放异彩:辅助驾驶到隐私保护四大项目全获五星
快科技6月2日消息,中汽中心C-ICAP智能网联测评结果正式公布,小米YU7拿下规程里的最高评级,在辅助驾驶、泊车、智能座舱、隐私保护几个项目全部拿到顶尖评分。自动泊车适配窄车位、斜列车位等多种场景,不用人为…

2026-06-03

小米YU7 GT开启交付新篇:雷军舒淇助阵,生态互联与性能外观获赞
交付盛况小米YU7GT正式交付,雷军与舒淇现身,首批车主对新车表示高度认可。生态互联YU7GT构建“人-车-家”生态,通过车辆可控制米家设备。驾驶途中可远程控制家中空调、灯光等。外观与性能车厘子红配色受追捧,…

2026-06-03