谷歌发布Gemini 2.5 Flash图像模型，“纳米香蕉”刷新图像生成能力新高度-信息流-ITBear科技资讯

谷歌近日震撼发布了一款名为Gemini 2.5 Flash Image的图像模型，业界戏称其为“nano-banana”。这款模型在图像编辑、角色一致性维持以及多图像融合等领域展现出了卓越的能力，为用户带来了前所未有的创作自由度。

据悉，Gemini 2.5 Flash Image模型此前已在LMArena平台上崭露头角，其强大的一致性和创造力赢得了广泛赞誉。用户评价称，该模型能够精准地按照指令生成图像，几乎是指哪打哪，这种高度的可控性让许多创作者为之兴奋。

为了让更多用户体验到这款模型的魅力，谷歌在GeminiApp和googleaistudio平台上提供了免费试用机会。同时，用户也可以在Gemini API上以每张图像0.039美元的价格使用该模型，这一价格与2.0 Flash图像生成服务相同，极具性价比。

在性能表现上，Gemini 2.5 Flash Image无疑是一款顶尖的图像生成模型。根据lmare.ai排行榜的数据显示，该模型在综合偏好度以及角色、创意、信息图表、物体/环境和风格化等多个细分领域均显著优于业界主流模型，如GPT 4o Image和FLUX.1 Kontext等。在LMArena的500多万场对战中，nano-banana凭借一己之力斩获超250万票，以171分的巨大优势刷新了历史纪录，创下了Arena历史上最大的Elo分数领先纪录。

为了让用户能够快速上手，谷歌对Google AI Studio进行了重大更新，推出了多个模板应用。这些模板应用不仅免费试用、修改和部署，还能够帮助用户愉快地探索nano-banana的各种有趣功能。用户可以通过这些模板应用，轻松体验到Gemini 2.5 Flash Image在角色一致性、自然语言精准编辑以及多图像融合等方面的卓越表现。

Gemini 2.5 Flash Image在保持角色一致性方面表现出色。它能够将同一个角色放置在不同的环境中，展示其在新环境中的多个角度，同时保留角色的主题和风格。该模型还擅长遵守视觉模板，能够根据用户的指令生成符合特定风格的图像。

除了角色一致性之外，Gemini 2.5 Flash Image还支持使用自然语言进行有针对性的转换和精确的本地编辑。例如，用户可以通过简单的提示让模型模糊图像的背景、去除污渍、改变拍摄对象的姿势或添加颜色等。这种灵活性和可控性让该模型在图像编辑领域具有广泛的应用前景。

nano-banana还能够理解和合并多个输入图像。用户可以将对象放入场景中，重新设置房间的样式，或者通过单个提示融合多个图像。为了展示这一功能，谷歌在Google AI Studio中构建了一个模板应用，用户可以将商品拖到新场景中，快速创建逼真的融合图片。

更令人惊喜的是，Gemini 2.5 Flash Image在对现实世界的理解上取得了突破。谷歌在Google AI Studio中构建了一个模板应用，将简单的画布变成了互动式教育导师。该模型能够阅读和理解手绘图表，帮助解决现实世界问题，并遵循复杂的编辑说明。这一功能不仅展示了nano-banana的强大实力，也为其在教育领域的应用提供了无限可能。