近期,一股名为“吉卜力画风”的热潮席卷了网络世界。这一趋势的起点,可以追溯至3月26日,OpenAI推出的基于GPT-4o多模态大模型的高精度图像生成功能——“4o Image Generation”。据OpenAI介绍,用户只需通过简单的文字描述,便能轻松实现广告、平面图、UI设计、LOGO风格转换等多种图像创作需求。
然而,令人意想不到的是,这一技术迅速被广大网友用于模仿日本著名动画导演宫崎骏的画风,一时间,网络上涌现出大量“赛博宫崎骏”作品。无论是群聊中的头像、表情包,还是对经典歌曲的MV进行重新绘制,GPT-4o都展现出了惊人的创作能力,让人叹为观止。推特上的国外网友更是乐此不疲,纷纷晒出自己的“吉卜力风”作品。
在国内,类似的功能也并非空白。字节跳动推出的SeedEdit模型,同样能够实现“自然语意修图”。用户只需输入自然语言指令,便可对图片进行多样化的编辑操作。这一功能无需翻墙,直接在字节跳动的豆包官网上即可使用,且目前完全免费,无任何限制。
为了亲身体验这一功能,我们上传了一张知名音乐录像带的截图,并指令豆包和GPT-4o将其转换为吉卜力风格。对比两者的作品,GPT-4o在衣物还原度和手部形态上表现更佳,但未能保持原图比例;而豆包则在构图和配色上更接近原图,但衣物细节有所变化,手部形态也略有变形。豆包还尝试为原图添加了额外的元素——一只抓着麦克风的手。
除了吉卜力风格,豆包还支持多种风格的转换。例如,将知名企业家马斯克和乔布斯转换为吉卜力或迪士尼风格,效果同样令人惊艳。豆包还尝试将影视剧集中的名场面进行画风转换,虽然与GPT-4o相比,在角色服装和形态上略有不足,但整体效果依然十分出色。
然而,随着吉卜力画风的火爆,也引发了一系列版权问题。早在2016年,宫崎骏就曾公开表示反对AI动画技术,认为这是对生命本身的侮辱。他坚持认为,AI生成图像缺乏对生命力的敬畏。如今,技术的进步反而让这一趋势愈演愈烈,这无疑是对宫崎骏观点的讽刺。
尽管如此,我们仍可以尝试将这一技术视为一种全新的图像编辑工具。例如,在设计行业中,“让大象转个身”这样的需求,豆包都能轻松实现。生成的大象背面形象逻辑严谨,耳朵、脚部、身体颜色等细节都处理得相当到位,周围环境也保持了一致性。
不过,在海报制作等方面,豆包的表现则稍显不足。与GPT-4o相比,豆包在审美和细节处理上还有待提升。豆包在图像生成时仍存在错字现象,且在人像前后一致性和图片内容方向性上也有所欠缺。
尽管如此,豆包SeedEdit仍然填补了国产大模型在语义AI修图应用领域的空白。随着AI图像编辑技术的不断发展,未来这一功能有望被集成到手机、电脑等日常设备中,成为普通人也能轻松上手使用的工具。届时,无论是专业设计师还是普通用户,都能通过这一技术将自己的审美理念直观地展现出来。