近期,一股名为“手办化”的风潮悄然在网络上兴起。这股潮流的源头,可以追溯到大约两周前,大模型竞技场LMArena上线的一款神秘模型——“nano banana”。据官方介绍,这是一款顶尖的图像生成与编辑模型,能够实现前所未有的创作控制力。
令人意想不到的是,这款模型迅速被互联网上的AIGC玩家们发掘,并纷纷变身“手办大师”。从将自己的头像制作成限量版GK模型,到将宠物猫狗“手办化”,甚至为尚未发布的《黑神话:钟馗》制作雕像和游戏盒,玩家们的创意层出不穷。推特上的国外网友也乐此不疲,纷纷晒出自己的“手办化”作品。
幸运的是,这次我们无需再羡慕他人。随着Google的正式发布,Gemini 2.5 Flash Image已通过Gemini API和Google AI Studio向公众开放预览。用户只需访问官网,就能直接体验到这款下一代图像模型的强大功能。更为贴心的是,在AI Studio里进行测试是完全免费的,这无疑为热爱尝鲜的玩家们大大降低了探索未来的门槛。
使用Gemini 2.5 Flash Image非常简单。打开Google AI Studio网页版,在Generate media选项卡下即可找到该模型。界面直观明了,一个提示词输入框,一个上传图片的区域,便是通往“手办化”新世界的大门。用户只需上传一张图片,然后用自然语言描述想要生成的内容,便能轻松实现“手办化”。
以一张来自漫画《捉摸不透的刑警织子桑》的角色图为例,通过输入相应的提示词,Gemini 2.5 Flash Image便能将其“手办化”。生成的图片效果逼真,无论是手办本身的材质、包装盒上的文字和品牌Logo,还是背景电脑屏幕上的建模界面,都处理得十分细腻。只有高度模糊的背景透露出些许人工生成的痕迹。
除了“手办化”,Gemini 2.5 Flash Image在修图方面同样表现出色。例如,对于因年代久远而模糊破损的老照片,它不仅能清除物理损伤,还能通过算法补全缺失的细节,并上色自然,充满温暖的时代气息。它还能实现“把白天改成黑夜”等设计行业里的经典要求,真正理解了“夜晚”、“灯光”、“下雨”等概念,并合乎物理逻辑地对整个画面进行重新渲染。
Gemini 2.5 Flash Image还能实现风格的无缝切换。例如,将《Panty&Stocking》中的画面转换成王家卫电影风格的写实电影剧照,它不仅做到了“三次元化”,还微妙地捕捉到了王家卫电影独特的色彩、光影和氛围感。这种跨越媒介和导演风格的能力,为艺术创作提供了更多可能性。
尽管Gemini 2.5 Flash Image在图像生成领域取得了重大突破,但并非完美无瑕。在处理极其复杂的场景时,它偶尔还是会出现轻微的逻辑错误或细节失真。对于一些过于抽象或违反物理常识的指令,它的理解能力也还有待提升。然而,这并不影响它成为AI图片生成应用的新标杆。
随着技术的不断成熟和成本的降低,未来手机、电脑的相册和编辑器可能会原生集成这项功能。无论是专业设计师还是普通用户,都有机会轻松上手,将自己脑海中的创意和对美的理解更直观、更高效地展现出来。修图有手就行?或许,这一天真的不再遥远。