ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里云栖大会发布7款大模型,通义万相Wan2.5-preview成AI视觉生成新标杆

时间:2025-09-26 18:35:18来源:互联网编辑:快讯

在杭州举办的云栖大会上,阿里巴巴集团一口气发布了七款人工智能大模型,其中最受瞩目的当属通义万相Wan2.5-preview。这款全模态视觉生成模型首次实现了音画一体的视频生成功能,标志着阿里在多模态技术领域取得了重大突破。

据阿里云智能集团首席技术官周靖人介绍,通义万相Wan2.5-preview采用了原生多模态架构,将文本、图像、音频等不同模态的数据统一处理。该模型集成了文生视频、图生视频、文生图和图像编辑四大功能模块,能够生成电影级别的视频内容,为用户提供全感官的叙事体验。

在实际测试中,Wan2.5-preview展现出了惊人的文本理解和推理能力。用户只需输入一段文字描述,模型就能自动生成与之匹配的语音和视频画面,且人物口型与语音完美同步。例如,当输入一段关于白人女性拆礼物的详细描述后,模型不仅生成了逼真的光影效果和人物表情,还精准还原了钢琴声和人物对话。

这款模型在视频生成方面实现了多项升级。视频时长从原来的5秒延长至10秒,支持24帧每秒的1080P高清输出,能够生成更完整的剧情故事。在操控性方面,模型对复杂指令的理解能力显著提升,可以完成运镜控制和人物变身等高级图像编辑任务。

Wan2.5-preview的最大亮点在于其原生多模态架构。这是国内首个将声音、图像、文本作为统一语料进行训练的模型,能够在同一框架下完成多种任务。相比传统非原生架构,这种设计避免了信息损耗和误差累积,使模型具备了更强的跨模态推理和生成能力。

在图像生成方面,该模型的美学质感和指令遵循能力都有显著提升。它能够根据复杂的诗歌描述生成意境匹配的图片,在图表生成和文字稳定性方面也表现出色。图像编辑功能支持丰富的指令操作,同时保持视觉元素的一致性。

具体应用案例展示了模型的强大能力。在生成婚礼求婚场景时,模型不仅准确还原了人物动作和光影效果,还完美匹配了婚礼进行曲和新郎的对话。对于极快语速的RAP说唱,模型也能确保人物口型与语音同步,毫无破绽。

音效生成是Wan2.5-preview的另一大特色。在骑士骑马和女子打网球的场景中,模型生成了马蹄声、裁判哨音、网球撞击声等环境音效,大大增强了视频的真实感。对于跳舞场景,模型还能根据描述生成匹配的背景音乐,准确把握嘻哈风格的节奏特点。

目前,用户可以通过阿里云百炼平台调用API,或直接在通义万相官网体验这款模型。阿里提供的官方数据显示,通义万相系列模型已支持十多种视觉创作功能,累计生成了3.9亿张图片和7000万个视频,成为中国调用量最大的视觉生成模型之一。

在开源领域,通义万相也取得了显著成果。自今年2月以来,该系列已连续开源20多款模型,在开源社区和第三方平台的下载量超过3000万次,成为最受欢迎的视频生成模型之一。随着世界模型的面世,阿里在人工智能领域的布局将更加完善。

更多热门内容
苹果iOS新测试版现端倪:支持MCP协议 悄然为AI智能体时代铺路
App Intents 是苹果提供给开发者的一个强大工具,它允许应用程序向系统(如Siri、聚焦搜索、快捷指令等)暴露其核心功能和内容。未来,开发者或许不再需要为每一个 AI 平台单独进行复杂的适配工作,而…

2025-09-26

OpenAI万亿美元砸向算力扩张 全球AI基建迈入“算力军备”新赛道
据了解,OpenAI已明确从以往的“模型驱动”战略转向“算力驱动”,此次披露的全球计算基础设施扩张战略,核心目标是应对下一代人工智能模型在训练与推理过程中对海量算力的需求。该计划不仅涉及在美国本土多地布局超…

2025-09-26

深度对话高通:旗舰三芯AI升级,探寻端侧AI如何破局用户需求与技术迭代
对于业内围绕AI做出的改变,马晓民谈道,近年手机端侧AI呈现出一些大的变化趋势,比如从过去单一的大语言模型到如今更多的多模态大模型,而不论是模型的变化还是芯片内部模块的变化,对于端侧AI体验来说,围绕的核心…

2025-09-26

阿里吴泳铭云栖大会演讲:AGI非终点,AI三阶段演进迈向超越人类的ASI时代
最近一年,全球AI行业的投资总额已经超过4000亿美元,未来5年全球AI的累计投入将超过4万亿美元,这是历史上最大的算力和研发投入,必然将会加速催生更强大的模型,加速AI应用的渗透。未来,几乎所有链接真实世界…

2025-09-26

阿里巴巴吴泳铭:AGI只是起点 未来AI将成核心商品引领智能时代
AGI的目标是将人类从80%的日常工作中解放出来,让我们专注于创造与探索。未来,几乎所有链接真实世界的工具接口都将与大模型进行链接,所有用户需求和行业应用将会通过大模型相关工具执行任务,LLM将会是承载用户…

2025-09-26

2025通信展聚焦:我国信息通信业加速现代化,人工智能大模型超1500个
工业和信息化部总工程师钟志红日前在2025中国国际信息通信展览会上说,近年来,我国信息通信行业现代化建设系统推进,竞争优势持续巩固提升。筑牢数字基础设施底座,加快推进5G-A、万兆光网试点部署,有序推进算力中…

2025-09-26