阿里巴巴近日宣布推出其视频生成模型HappyHorse的1.1版本,这一升级版本在多个关键维度上实现了显著提升,包括动态表现力、主体一致性、指令遵循能力、视觉质感以及音频效果。该模型自发布以来,已广泛应用于短剧制作、电商广告、品牌营销和游戏CG等多个内容生产领域。
动态表现力的优化是此次升级的重点之一。针对1.0版本中存在的画面动作迟缓、节奏感不足的问题,1.1版本通过改进运动建模和时序一致性能力,使动作更加连贯且富有力量感。这一改进使得生成的视频在动态场景中表现更为自然流畅。
在主体一致性方面,新版本支持同时输入多达9张角色参考图,确保商品细节、品牌元素以及角色与场景的组合保持稳定。这一功能在多角色短剧、直播带货和多人物广告等场景中尤为重要,有效减少了角色“变脸”的情况,提升了内容生产者的效率。
指令遵循能力也得到了显著增强。无论是简短的描述还是复杂的叙事输入,1.1版本都能更好地理解提示词。例如,在高强度动态场景如打斗中,简洁的提示词即可被准确理解;对于复杂提示词,镜头编排的稳定性也大幅提升,能够高质量完成多场景、多角色的连贯演绎。
视觉质感和音频效果同样得到了专项优化。此前用户反馈集中的“油光感”“过度锐化”等问题得到了明显改善,模型能够保留痘印、法令纹、毛孔等细节的真实感,满足短剧、广告等对画面质感要求较高的场景。台词表达更加自然,语速、停顿和语气能够根据场景和情绪动态调整,用户还可以在提示词中描述背景和环境音效。
在技术规格上,HappyHorse 1.1版本与1.0版本保持一致,单次生成时长为3到15秒,支持720p和1080p分辨率以及自由宽高比。目前,该模型的最新版本已接入HappyHorse官网、阿里云百炼和千问云平台,供用户使用。
为庆祝新版本的发布,HappyHorse联合虎鲸文娱集团举办了“Horsepower”AI影像大赛。优胜者将有机会获得百万商单合作,并由著名导演、制片人张纪中等担任评委。此次大赛面向全球AIGC创作者开放,用户可通过HappyHorse官网报名参与。