通义万相2.1大升级：视频图像生成，能力飞跃新高度！-业界动态-ITBear科技资讯

阿里通义万相发布2.1版模型，视频与图像生成能力大幅提升

阿里巴巴旗下的通义万相平台近期推出了其2.1版本的模型升级，此次升级着重增强了视频与图像生成的功能，为用户带来了更为丰富和优质的创作体验。

在视频生成领域，通义万相2.1版引入了自主研发的高效VAE和DiT架构，这一创新不仅显著提升了时空上下文建模的能力，还成功实现了中文文字视频生成的功能。据悉，该功能在VBench榜单中已经取得了领先地位，彰显了通义万相在视频生成技术上的深厚积累。

不仅如此，通义万相2.1版还为用户提供了中英文视频一键生成艺术字的便捷功能，并配备了多种视觉效果选项，如过渡效果、粒子效果以及模拟效果等。用户可以根据自己的创作需求，自由选择并添加合适的特效，从而进一步提升视频的表现力和观赏性。

在图像生成方面，通义万相2.1版同样带来了显著的进步。该版本采用了IC-LoRA图像生成训练方法，并借助DiT架构来增强文本到图像的上下文能力。通过这一技术，用户可以轻松实现多张图像的拼接与联合描述，从而生成关联性强且特征稳定连续的图像组合。

此次通义万相2.1版的模型升级，不仅提升了视频和图像生成的质量与效率，更为用户提供了更为多样化、个性化的创作选择。无论是想要制作中文文字视频的用户，还是需要生成关联图像组合的设计师，都能在通义万相2.1版中找到满意的解决方案。