ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

快手可灵数字人2.0全量上线:三步生成,表现力升级支持5分钟长内容

时间:2025-12-05 06:03:49来源:互联网编辑:快讯

可灵数字人迎来重大升级,其全新2.0版本现已面向所有用户开放使用。用户只需完成上传角色图像、输入配音文本、设定角色表现三个简单步骤,即可快速生成具备专业表演能力的数字人视频内容。

此次升级在原有功能基础上实现了三大技术突破。新版本不仅强化了数字人的表情表现力,更通过深度优化算法实现了手部动作与口型同步的精准控制。在内容时长方面,单段视频生成上限从1分钟延长至5分钟,为创作者提供更广阔的叙事空间。升级后的系统能够智能解析文本语义,自动匹配符合情境的肢体语言、表情变化和镜头运动,使数字人呈现更具感染力的情绪表达。

回顾该功能的发展历程,今年9月首次推出的数字人生成系统已具备行业领先水平。当时的技术方案通过单张角色图片与文字/音频输入,即可生成1080p分辨率、48帧率的视频内容。其核心优势在于采用Transformer架构的DiT模型,该模型在时序信息处理和细节控制方面表现突出,能够精准捕捉面部特征变化,实现口型与语音的毫秒级同步,同时根据语义内容自动生成匹配的微表情和肢体动作,确保数字人形象在视频全程保持高度一致性。

技术团队透露,此次升级着重优化了动作生成模块的算法复杂度,通过引入更精细的骨骼控制参数,使手部动作的生成精度提升40%。在口型同步方面,新系统采用多模态融合训练方法,将语音特征与面部肌肉运动数据联合建模,使口型匹配准确率达到98%以上。这些技术突破使得数字人能够胜任新闻播报、产品解说、剧情短片等多样化场景的应用需求。

更多热门内容
黄仁勋CES首秀聚焦物理AI:开源模型与新架构齐发,GPU新品暂缺席
在这场演讲中,黄仁勋把重点放在了英伟达在物理AI领域的进展,包括自动驾驶和机器人,相关开源模型和工具等。 在CES上,黄仁勋推出了名为Alpamayo的开源AI模型、仿真工具及数据集,目的是推动推理型辅助驾…

2026-01-06

三星发力AI赛道:今年拟将Galaxy AI移动设备产量提至8亿台
【环球网科技综合报道】1月6日消息,在全球人工智能竞争愈发白热化的当下,三星电子正积极发力,计划在今年大幅扩充人工智能移动设备的产量。据路透社报道,三星电子联合首席执行官近日透露,公司今年计划将搭载“Gal…

2026-01-06

马斯克断言2026迎AI奇点,程序员角色转型在即,技术跃升时代来临
这股Claude Code热潮确实来势汹汹,Midjourney创始人就公开分享,圣诞假期里他敲的代码量,居然比过去十年的总和还多,即便能感受到些许局限,但也明确意识到一切都不一样了,Anthropic之父…

2026-01-06