百度近期在AI领域的动作引发了广泛关注。在7月2日举办的百度AI Day开放日上,百度宣布了一项重要更新:其搜索功能将接入由商业研发团队自主开发的视频生成模型MuseSteamer,以及配套的创作平台“绘想”。这一举动标志着百度在视频生成技术上的立场发生了显著变化。
回溯至去年10月,百度创始人李彦宏曾明确表示,百度不会涉足类似Sora的视频生成模型。据当时的内部讲话透露,李彦宏认为这类模型的投入周期长,可能在10年甚至20年内都无法获得业务收益,因此百度选择不参与。然而,随着AI2.0时代的加速到来,特别是在AI搜索场景中,用户对富媒体输出的需求日益增长,百度不得不重新审视其策略。
MuseSteamer模型的推出,正是百度应对这一变化的举措之一。作为全球首个实现中文音视频一体化生成的视频模型,MuseSteamer打破了传统AIGC视频制作中“先画面后配音”的固定流程,实现了画面、音效与人声台词的协同创作。这一技术突破,不仅提升了视频制作的效率,更在质量上达到了新的高度。
MuseSteamer在权威榜单VBench I2V中以89.38%的总分夺得全球第一,其强大的性能得到了充分证明。该模型支持从一张图片生成10秒长的1080p电影级画质视频,人物微表情与运镜效果均达到专业影视水准。这些成就的背后,是亿级中文多模态数据的清洗、精细化视频结构化描述语言的应用,以及多目标强化学习等技术的不断优化。
为了满足不同用户的需求,MuseSteamer模型家族推出了多个版本,包括Turbo、Lite、Pro及全系列有声版,覆盖了从普通创作者到专业影视机构的广泛需求。目前,Turbo版已在绘想平台上开启限时免费公测,其他版本也将于8月陆续上线。为了进一步推动AI视频创作的发展,绘想平台还同步启动了“跨次元捏合”AI视频创作大赛,鼓励用户通过单图输入生成动态视频作品参与竞赛。
百度的这一系列动作,不仅展示了其在AI技术上的持续创新,也反映了其对市场需求的敏锐洞察。随着AI技术的不断进步和应用场景的不断拓展,百度正通过不断调整和优化其策略,以适应行业发展的新趋势。