ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌发布Gemini 2.5 Flash图像模型,“纳米香蕉”刷新图像生成能力新高度

时间:2025-08-27 02:52:08来源:AI寒武纪编辑:快讯团队

谷歌近日震撼发布了一款名为Gemini 2.5 Flash Image的图像模型,业界戏称其为“nano-banana”。这款模型在图像编辑、角色一致性维持以及多图像融合等领域展现出了卓越的能力,为用户带来了前所未有的创作自由度。

据悉,Gemini 2.5 Flash Image模型此前已在LMArena平台上崭露头角,其强大的一致性和创造力赢得了广泛赞誉。用户评价称,该模型能够精准地按照指令生成图像,几乎是指哪打哪,这种高度的可控性让许多创作者为之兴奋。

为了让更多用户体验到这款模型的魅力,谷歌在GeminiApp和googleaistudio平台上提供了免费试用机会。同时,用户也可以在Gemini API上以每张图像0.039美元的价格使用该模型,这一价格与2.0 Flash图像生成服务相同,极具性价比。

在性能表现上,Gemini 2.5 Flash Image无疑是一款顶尖的图像生成模型。根据lmare.ai排行榜的数据显示,该模型在综合偏好度以及角色、创意、信息图表、物体/环境和风格化等多个细分领域均显著优于业界主流模型,如GPT 4o Image和FLUX.1 Kontext等。在LMArena的500多万场对战中,nano-banana凭借一己之力斩获超250万票,以171分的巨大优势刷新了历史纪录,创下了Arena历史上最大的Elo分数领先纪录。

为了让用户能够快速上手,谷歌对Google AI Studio进行了重大更新,推出了多个模板应用。这些模板应用不仅免费试用、修改和部署,还能够帮助用户愉快地探索nano-banana的各种有趣功能。用户可以通过这些模板应用,轻松体验到Gemini 2.5 Flash Image在角色一致性、自然语言精准编辑以及多图像融合等方面的卓越表现。

Gemini 2.5 Flash Image在保持角色一致性方面表现出色。它能够将同一个角色放置在不同的环境中,展示其在新环境中的多个角度,同时保留角色的主题和风格。该模型还擅长遵守视觉模板,能够根据用户的指令生成符合特定风格的图像。

除了角色一致性之外,Gemini 2.5 Flash Image还支持使用自然语言进行有针对性的转换和精确的本地编辑。例如,用户可以通过简单的提示让模型模糊图像的背景、去除污渍、改变拍摄对象的姿势或添加颜色等。这种灵活性和可控性让该模型在图像编辑领域具有广泛的应用前景。

nano-banana还能够理解和合并多个输入图像。用户可以将对象放入场景中,重新设置房间的样式,或者通过单个提示融合多个图像。为了展示这一功能,谷歌在Google AI Studio中构建了一个模板应用,用户可以将商品拖到新场景中,快速创建逼真的融合图片。

更令人惊喜的是,Gemini 2.5 Flash Image在对现实世界的理解上取得了突破。谷歌在Google AI Studio中构建了一个模板应用,将简单的画布变成了互动式教育导师。该模型能够阅读和理解手绘图表,帮助解决现实世界问题,并遵循复杂的编辑说明。这一功能不仅展示了nano-banana的强大实力,也为其在教育领域的应用提供了无限可能。

更多热门内容