ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

百度自研视频生成模型MuseSteamer:中文音视频一体化,图生电影级高清视频

时间:2025-07-02 21:55:47来源:上海证券报编辑:快讯团队

百度商业研发团队近期在视频生成技术领域取得了重大进展,于7月2日正式推出了自研的视频生成模型“MuseSteamer”及其配套的创作平台“绘想”。这一创新成果标志着百度在AI视频生成领域迈出了关键一步,特别是针对中文音视频一体化生成方面。

MuseSteamer的核心亮点在于其能够打破传统视频制作的常规流程,实现了画面、音效与人声台词的同步创作。以往的视频生成技术往往遵循“先画面后配音”的模式,而MuseSteamer则能够同步处理这些元素,大大提升了视频创作的效率与流畅度。

在技术层面,MuseSteamer展现了多项突破性的能力。它能够根据一张图片,迅速生成长达10秒、分辨率为1080p的电影级画质视频。视频中的人物微表情与运镜效果均达到了专业影视制作的标准。这些能力的背后,是百度团队对亿级中文多模态数据的深度清洗、精细化视频结构化描述语言的开发,以及多目标强化学习等先进技术的综合应用。

MuseSteamer模型家族涵盖了Turbo、Lite、Pro及全系列有声版等多个版本,旨在满足不同用户群体的需求,从普通创作者到专业影视机构都能找到适合自己的工具。目前,Turbo版已在绘想平台上开启限时免费公测,其他版本也将在8月内陆续向公众开放。

更多热门内容