ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里云万相2.1视频生成大模型全面开源,14B与1.3B版本任你探索!

时间:2025-02-26 01:07:18来源:ITBEAR编辑:快讯团队

近日,三言科技从阿里云方面获悉,其研发的视频生成大模型——万相2.1(Wan)已正式宣布开源。此次开源遵循Apache2.0协议,涵盖了14B和1.3B两种参数规格的全部推理代码及权重,为全球开发者提供了强大的视频生成工具。

开发者们现在可以在Github、HuggingFace以及魔搭社区等平台上下载并体验这一前沿技术。万相2.1不仅支持文字生成视频的功能,还能实现图片生成视频的任务,极大地拓宽了视频创作的边界。

在万相2.1的两个开源版本中,14B版本展现出了卓越的性能。它在指令遵循、复杂运动生成、物理建模以及文字视频生成等多个方面均表现出色。在权威评测集Vbench中,万相2.1以86.22%的总分,遥遥领先于国内外的Sora、Luma、Pika等模型,稳居评测榜首。

而1.3B版本的万相模型同样不容小觑。尽管其参数规模较小,但性能却超越了部分更大尺寸的开源模型,甚至与一些闭源模型的结果相近。更为重要的是,这一版本的模型对硬件要求较低,能够在消费级显卡上流畅运行。仅需8.2GB的显存,就能生成480P的视频,这为二次模型开发和学术研究提供了极大的便利。

更多热门内容
2025年:中国芯片企业借AI浪潮,破局重生
2025年是AI应用的爆发年,也是关乎国产算力企业兴衰存亡的关键之年。现在真正做到了芯片、模型助力场景应用,场景反馈回来的数据,又增加了模型跟芯片进一步地迭代,形成了一个非常良性的正向循环。”我们从芯片厂商的…

2025-08-04