阿里巴巴近日宣布推出全新升级的视频生成模型HappyHorse1.1,在动态表现、主体稳定性、指令理解、视觉效果和音频处理等多个维度实现显著突破。该版本针对1.0版本存在的画面动作迟缓、节奏感不足等问题,通过优化运动建模算法和时序一致性技术,使生成视频的动作连贯性和力量感得到大幅提升,尤其在打斗、运动等高强度场景中表现更为流畅自然。
针对内容创作者普遍关注的主体一致性难题,1.1版本创新支持同时输入9张角色参考图,通过增强的多分镜理解能力和N宫格参考技术,确保商品细节、品牌元素、角色特征与场景组合的稳定性。这一改进使得多角色短剧、直播带货、广告制作等场景中"角色变脸"的概率大幅降低,创作效率显著提升。据测试,在复杂场景中,模型对角色特征的保持准确率较前代提升超过40%。
在指令理解方面,新版本展现出更强的语义解析能力。无论是简短的描述性指令还是复杂的多层次叙事,模型都能精准捕捉核心要素。对于打斗等动态场景,仅需"两人对打"等简洁提示即可生成符合预期的画面;面对复杂指令时,镜头切换的稳定性和多角色互动的连贯性得到明显优化,能够高质量完成跨场景叙事任务。
视觉与听觉体验的升级成为本次迭代的另一亮点。通过专项优化算法,模型有效解决了前代用户反馈的"油光过重""过度锐化"等问题,在保留皮肤纹理、毛孔等真实细节的同时,使画面质感更符合影视级标准。音频处理方面,台词生成系统实现动态语调调整,可根据场景情绪自动匹配语速、停顿和语气,并支持在提示词中指定背景音效和环境声,为创作者提供更丰富的声音设计空间。
技术参数方面,HappyHorse1.1延续了前代3-15秒的单次生成时长,支持720p/1080p分辨率输出及自由宽高比设置。自上线以来,该模型已广泛应用于短剧制作、电商广告、品牌营销、游戏CG等多个领域,累计服务超过2000家内容机构。目前,阿里巴巴正与虎鲸文娱集团联合举办"Horsepower"AI影像创作大赛,设立百万级商业合作奖励,由知名导演张纪中等业内专家组成评审团,创作者可通过官方平台提交作品参赛。
