ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里Qwen团队再发力:Qwen3-Omni全模态AI与Qwen-Image-Edit-2509图像编辑工具双双亮相

时间:2025-09-23 07:07:03来源:小AI编辑:快讯

阿里旗下Qwen团队近日动作频频,接连推出两款具有突破性的AI模型——Qwen3-Omni与Qwen-Image-Edit-2509,引发业界广泛关注。其中,Qwen3-Omni作为全球首个原生端到端全模态AI模型,标志着多模态技术进入全新发展阶段。

Qwen3-Omni的核心突破在于其“一体化”设计理念。传统多模态模型常面临文本、图像、音视频处理能力难以平衡的困境,而该模型通过统一架构实现了四大模态的无缝融合。在性能测试中,该模型在36项音视频基准中22项达到行业顶尖水平,尤其在长音频理解方面表现突出——可精准解析长达30分钟的语音内容,响应延迟仅211毫秒。

语言支持能力成为另一大亮点。模型支持119种语言的文本处理、19种语言的语音输入及10种语言的语音输出,覆盖全球主要语言体系。其高度可控的特性允许开发者通过系统提示词自定义模型行为,配合内置的工具调用功能,可轻松对接各类应用服务。更值得关注的是,团队同步开源了低幻觉字幕生成模型,为音视频内容处理提供可靠解决方案。

开发团队已开放多个模型版本供全球开发者使用,包括Qwen3-Omni-30B-A3B-Instruct等指令遵循模型及创意任务模型。开发者可通过Hugging Face平台获取相关资源,web端体验入口也同步开放,用户可实时测试模型性能。

同步推出的Qwen-Image-Edit-2509则聚焦图像编辑领域,在一致性控制方面实现重大突破。该模型支持多图协同编辑,可将人物与产品、场景等不同元素无缝融合,同时保持视觉一致性。单图编辑功能同样强大:人脸特征在姿势变换、滤镜调整等操作中保持高度稳定;广告产品可维持核心设计元素;文字编辑支持内容、字体、颜色及材质的全维度修改。

技术层面,模型内置的ControlNet功能成为关键创新。开发者可通过深度图、边缘检测等控制参数,实现对图像生成的精准调控。这种“即插即用”的设计大幅降低了专业编辑的技术门槛,使复杂图像处理变得更为简便。

据开发团队透露,Qwen-Image-Edit-2509的发布标志着图像生成技术进入精细化控制时代。其详细技术说明与案例演示已通过官方博客对外公布,包含多组对比实验数据及实际应用场景展示。

两款模型的推出不仅展现了阿里在AI领域的技术积累,更通过开源策略推动行业生态发展。随着更多开发者参与模型优化与应用拓展,全模态AI技术的商业化落地进程有望进一步加速。

更多热门内容
爱工友小程序:以标准化信息流重塑建筑行业一线协作新范式
数字化协作并非简单地将线下流程线上化,其核心在于通过特定工具重构信息流动的路径与规则,从而压缩从决策到执行的周期。其效能体现在将非标准的交互转化为标准化的数据交换,将串联的、延迟的信息流改造为并联的、实时的状…

2026-04-19

2026年数控智能小导管生产线选型攻略:精准适配隧道等多场景建设需求
导语:在评估数控智能小导管生产线厂家时,可从企业规模、客户真实评价、产品质量稳定性、服务网络覆盖度、行业适配经验等维度进行考量。 综合实力:旭辉(山东)智能装备有限公司专注于工业智能装备领域,核心业务范围涵…

2026-04-19

估值3409亿!00后创办的AI编程独角兽Cursor获巨额融资,英伟达参投
智东西4月18日消息,据TechCrunch今日报道,4位知情人士透露,美国明星AI编程独角兽Cursor即将完成新一轮融资,预计将融资超过20亿美元(约合人民币136亿元),估值将达到500亿美元(约合人…

2026-04-19