ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

生数科技Vidu Q1大模型发布:视频动作行为,皆可精准调控

时间:2025-03-29 18:21:31来源:ITBEAR编辑:快讯团队

近日,清华大学人工智能研究院的一项重大创新引发了业界的广泛关注。该研究院副院长、同时也是生数科技创始人及首席科学家的朱军,正式推出了名为Vidu Q1的高可控视频大模型,这一成果被标榜为行业内首个具备高度可控性的AI视频大模型。

据官方介绍,Vidu Q1在多个关键技术领域实现了显著突破,尤其是在多主体细节可控性、音效同步控制以及画质增强方面。以多主体细节可控为例,该模型不仅能够基于语义指令进行操作,还能融入参考图的视觉信息,进一步实现对视频中多个主体位置、大小、运动轨迹等属性的精确控制。无论是角色的出场顺序、退场方式,还是坐立姿态、行动路线,Vidu Q1都能进行细致入微的调整,以满足用户的多样化需求。

在音效同步控制方面,Vidu Q1同样表现出色。它能够根据视频环境的变化和画面的切换,自动生成相应的音效,并实现对音效长短区间和出现时间点的精准控制。例如,在视频的前两秒内,可以精确设置风声作为背景音效,而在接下来的三到五秒内,则切换为雨声,从而营造出更加真实、生动的视听体验。

这一创新成果的问世,标志着AI视频生成技术迈上了一个新的台阶。Vidu Q1的高可控性不仅为用户提供了更加灵活多样的视频创作方式,也为视频制作、动画制作、广告创意等行业带来了全新的可能性。可以预见,随着该技术的不断成熟和推广,它将在未来发挥更加重要的作用,推动相关行业的快速发展。

更多热门内容
OpenAI六年首推开源语言模型,400亿融资助力AI新突破
“We are excited to release a powerful new open-weight language modelwith reasoning in the coming month…

2025-04-01

当贝AI知识库:三步打造专属知识体系,效率翻倍!
近日,国内人工智能领域迎来新亮点,当贝AI推出了全新的“个人知识库”功能,这一创新迅速吸引了业界的广泛关注。尽管市场上AI工具众多,但具备构建个人知识库功能的AI工具却寥寥无几。当贝AI知识库上线后,迅速获得了市场的强烈反响。本文将对当贝AI个人知识库的核心特点、

2025-04-01