近期,谷歌在AI技术领域的布局再次迈出重要一步,宣布将旗下的Veo 2视频生成模型引入Gemini Advanced订阅服务中。此举被视为对OpenAI的Sora视频生成平台的有力回应,彰显了谷歌在竞争日益白热化的AI市场中抢占先机的决心。
就在这一消息发布前不久,合成媒体行业的另一巨头Runway也发布了其最新的第四代视频生成器,并成功募集到超过21.93亿元人民币的新资金,为行业注入了新的活力。
从本周二起,Gemini Advanced订阅用户已能在Gemini应用的模型选项中找到Veo 2。借助这一模型,用户可以轻松创建出时长8秒、分辨率为720p、宽高比为16:9的视频片段,并通过Gemini内置的“分享”功能直接上传至TikTok、YouTube等平台。生成的视频还支持下载为带有谷歌SynthID水印的MP4文件,虽然目前谷歌对每月可创建的视频数量设有限制,且该功能暂不支持谷歌Workspace的商业和教育计划。
值得注意的是,谷歌还将Veo 2整合进了其Google Labs的实验性功能Whisk中。Whisk原本允许用户使用图片作为Gemini的提示词来生成新图片,而此次新增的Whisk Animate功能则实现了将用户生成的图片转化为由Veo 2生成的8秒视频。作为谷歌展示早期AI产品的平台,Google Labs目前仅对Google One AI Premium订阅用户开放,订阅费用为每月20美元。
尽管目前Veo 2的应用场景相对基础,但谷歌DeepMind的首席执行官德米斯·哈萨比斯已透露,公司正计划将Gemini AI模型与Veo相结合,以进一步提升Gemini对物理世界的理解能力。这一举措无疑将加速谷歌在AI领域的创新步伐。
然而,随着Veo 2等视频生成工具的涌现,也引发了艺术家和创作者们的广泛担忧。这类工具可能会对整个创意产业带来颠覆性的影响。据好莱坞动画师和漫画家工会委托进行的一项研究显示,预计到2026年,AI将扰乱美国超过10万个电影、电视和动画领域的就业岗位。这一预测无疑为创意产业的未来发展蒙上了一层阴影。