ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

通义万相2.1大升级:视频图像生成,能力飞跃新高度!

时间:2025-01-10 14:59:23来源:ITBEAR编辑:快讯团队

阿里通义万相发布2.1版模型,视频与图像生成能力大幅提升

阿里巴巴旗下的通义万相平台近期推出了其2.1版本的模型升级,此次升级着重增强了视频与图像生成的功能,为用户带来了更为丰富和优质的创作体验。

在视频生成领域,通义万相2.1版引入了自主研发的高效VAE和DiT架构,这一创新不仅显著提升了时空上下文建模的能力,还成功实现了中文文字视频生成的功能。据悉,该功能在VBench榜单中已经取得了领先地位,彰显了通义万相在视频生成技术上的深厚积累。

不仅如此,通义万相2.1版还为用户提供了中英文视频一键生成艺术字的便捷功能,并配备了多种视觉效果选项,如过渡效果、粒子效果以及模拟效果等。用户可以根据自己的创作需求,自由选择并添加合适的特效,从而进一步提升视频的表现力和观赏性。

在图像生成方面,通义万相2.1版同样带来了显著的进步。该版本采用了IC-LoRA图像生成训练方法,并借助DiT架构来增强文本到图像的上下文能力。通过这一技术,用户可以轻松实现多张图像的拼接与联合描述,从而生成关联性强且特征稳定连续的图像组合。

此次通义万相2.1版的模型升级,不仅提升了视频和图像生成的质量与效率,更为用户提供了更为多样化、个性化的创作选择。无论是想要制作中文文字视频的用户,还是需要生成关联图像组合的设计师,都能在通义万相2.1版中找到满意的解决方案。

更多热门内容