ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

光是蚂蚁呀嘿还不够,AI Studio带你玩转“照片活化”等视频特效

时间:2021-03-02 20:29:40来源:互联网编辑:星辉

这两天最让人上头的神曲是什么?非“蚂蚁呀嘿”莫属呀!

这个仅用一张照片、一段视频就能做的魔性视频,这两天在某博、某抖和某手上疯狂刷屏。傲娇的表情配合洗脑的音乐,再加上各界大佬的倾情演绎,让人看过一遍就再也忘不了,真可谓“失眠时,没有一只蚂蚁是无辜的。”

图片%201.png

“蚂蚁呀嘿”火爆全网,各式各样的制作教程也随之而来。其中,最方便的莫过于用PaddleGAN(百度飞桨的生成对抗网络工具套件)来实现。它不仅完全免费,还省去了下载Avatarify(最新消息,该App已被下架)和加速器等多个软件的麻烦,让你无需下载和频繁切换,三步就能生成自己的“蚂蚁呀嘿”小视频。

接下来就给大家介绍两种制作方法,并揭秘背后的核心技术原理。

第一种:“小白版”教程

首先,大家可以点击下方链接,进入AI Studio(人工智能学习与实训社区)中的【天下第一AI武道会-Deepfake换脸】项目,“基础版”或“高级版”两种运行环境皆可:

https://aistudio.baidu.com/aistudio/projectdetail/1189026

第二步是备好素材:一张源图片和一个驱动视频。源图片就是你想让他唱歌的照片,只保留人物脖子以上部分,尺寸要求256*256,图片文件名改为【01. png】。驱动视频则是单人唱着“蚂蚁呀嘿”的小视频,可以从网上直接搜索下载,视频文件名改为【02. mp4】。(注意png和mp4都是小写)

第三步上传图片和视频,并点击“运行全部”,然后静候几分钟即可。待页面左侧出现名为“export. mp4”的文件,即为运行成功,专属于你的“蚂蚁呀嘿”就这样出炉啦。

(第一步:在AI Studio中搜索并运行项目)

(第二步:备好一张源图片和一个驱动视频)

(第三步:上传素材并运行全部)

第二种:“进阶版”教程

因为有些同学不只想做“蚂蚁呀嘿”,还想自己录制面部动作,生成任意题材的花样视频,甚至是开发Avatarify这样的App或小程序,走上“致富之路”,而这通过飞桨也都能实现。

飞桨已将蚂蚁呀嘿的核心技术开源于PaddleGAN套件中,在AI Studio平台实现了完整的在线项目【PaddleGAN表情动作迁移进阶版】,大家可以根据需要,使用AI Studio的免费算力,实现更多脑洞大开的动作迁移效果!

https://aistudio.baidu.com/aistudio/projectdetail/1586056

进阶版制作起来同样分为三步,并都是在AI Studio平台上实现,这里继续以“蚂蚁呀嘿”为例进行介绍。首先,大家可以下载PaddleGAN代码。

!git clone https://gitee.com/PaddlePaddle/PaddleGAN

!pip install -r requirments.txt

接下来,使用表情迁移命令。

命令:

!export PYTHONPATH=$PYTHONPATH:/home/aistudio/work/PaddleGAN && python -u tools/first-order-demo.py --driving_video ~/fullbody.MP4 --source_image ~/秃头乔哥.png --relative --adapt_scale

只需在如下命令中的driving_video参数和source_image参数分别换成自己的视频(蓝色部分)和照片路径(黄色部分),即可运行得到“蚂蚁呀嘿”小视频。

这个视频目前还没有配乐,所以还需要第三步,为视频配上声音。

运行以下命令即可生成最终的“蚂蚁呀嘿”专属视频啦(本例中的视频文件名为export.mp4)!

videoclip_1 = VideoFileClip("/home/aistudio/fullbody.MP4")

videoclip_2 = VideoFileClip("./output/result.mp4")

audio_1 = videoclip_1.audio

videoclip_3 = videoclip_2.set_audio(audio_1)

videoclip_3.write_videofile("./output/export.mp4", audio_codec="aac")

(生成效果图)

“蚂蚁呀嘿”视频的核心技术是动作迁移算法First Order Motion,它的功能是将人物A的脸部动作搬移到人物B身上,让人物B的脸演绎人物A的表情。

First Order Motion算法的结构图如下:

简单来说,First Order Motion能够通过自监督的方式学习到图像中的关键点。不需要提前知道目标的一些信息,比如骨架等就可以实现动作迁移。

PaddleGAN的表情迁移能力灵活支持各类不同表情的面部迁移,不仅是“蚂蚁呀嘿”,其他魔性动作也都能制作。除此之外,PaddleGAN这个免费开源的宝藏套件还包含数十种能力,包括唇形合成(对嘴型)、视频/照片修复(上色、超分、插帧)、人脸动漫化、照片动漫化等等。能实现让“蒙娜丽莎”播新闻、修复百年前的老照片、或是将普通的风景照“二次元化”等各种神操作,一个比一个厉害!

(唇形合成)

(老照片修复)

(照片动漫化)

如果你也想不下载App就能做魔性视频,或是有更多、更大的脑洞想要实现,指路百度AI Studio亲自试试吧!

更多热门内容
AI焕视,E飞冲天!飞利浦显示器2025年渠道合作伙伴大会在泉州成功举办
2025年4月10日,中国显示器市场外资第一品牌飞利浦显示器,携全国终端渠道合作伙伴在福建泉州,隆重举办了以“AI焕视,E飞冲天”为主题的2025年渠道合作伙伴会议。2025年飞利浦显示器渠道大会隆重召开冠捷科技总裁宣建生博士通过视讯会议的方式参会并做重要讲话。冠捷科技资

2025-04-15

高端轻薄质感,专业性能轻薄本ROG幻16 Air 2025搭载RTX™ 5080登场
备受内容创作者关注,由NVIDIA® GeForce RTX™ 5080笔记本电脑GPU驱动澎湃性能的专业性能轻薄本,ROG幻16 Air 2025现已正式开售。GeForce RTX™ 50系列笔记本电脑GPU搭载NVIDIA Blackwell架构,为游戏玩家和创作者带来全新玩法。RTX™ 50系列具备强大的AI算力,RTX™ 5

2025-04-11

引领开放式聆听!Shokz韶音登顶全球运动耳机销量第一
近期,根据洛图科技《中国耳机耳麦零售市场月度追踪》报告数据显示,2024年,中国耳机耳麦市场的全渠道销量为2.18亿副,同比增长7.6%;销额为428亿元,同比增长9.8%。这已经是中国耳机耳麦市场连续第五年保持增长的态势。而在中国耳机耳麦传统主流电商500元以上高端市场

2025-04-11