阿里Qwen团队再发力：Qwen3-Omni全模态AI与Qwen-Image-Edit-2509图像编辑工具双双亮相-信息流-ITBear比尔科技

阿里旗下Qwen团队近日动作频频，接连推出两款具有突破性的AI模型——Qwen3-Omni与Qwen-Image-Edit-2509，引发业界广泛关注。其中，Qwen3-Omni作为全球首个原生端到端全模态AI模型，标志着多模态技术进入全新发展阶段。

Qwen3-Omni的核心突破在于其“一体化”设计理念。传统多模态模型常面临文本、图像、音视频处理能力难以平衡的困境，而该模型通过统一架构实现了四大模态的无缝融合。在性能测试中，该模型在36项音视频基准中22项达到行业顶尖水平，尤其在长音频理解方面表现突出——可精准解析长达30分钟的语音内容，响应延迟仅211毫秒。

语言支持能力成为另一大亮点。模型支持119种语言的文本处理、19种语言的语音输入及10种语言的语音输出，覆盖全球主要语言体系。其高度可控的特性允许开发者通过系统提示词自定义模型行为，配合内置的工具调用功能，可轻松对接各类应用服务。更值得关注的是，团队同步开源了低幻觉字幕生成模型，为音视频内容处理提供可靠解决方案。

开发团队已开放多个模型版本供全球开发者使用，包括Qwen3-Omni-30B-A3B-Instruct等指令遵循模型及创意任务模型。开发者可通过Hugging Face平台获取相关资源，web端体验入口也同步开放，用户可实时测试模型性能。

同步推出的Qwen-Image-Edit-2509则聚焦图像编辑领域，在一致性控制方面实现重大突破。该模型支持多图协同编辑，可将人物与产品、场景等不同元素无缝融合，同时保持视觉一致性。单图编辑功能同样强大：人脸特征在姿势变换、滤镜调整等操作中保持高度稳定；广告产品可维持核心设计元素；文字编辑支持内容、字体、颜色及材质的全维度修改。

技术层面，模型内置的ControlNet功能成为关键创新。开发者可通过深度图、边缘检测等控制参数，实现对图像生成的精准调控。这种“即插即用”的设计大幅降低了专业编辑的技术门槛，使复杂图像处理变得更为简便。

据开发团队透露，Qwen-Image-Edit-2509的发布标志着图像生成技术进入精细化控制时代。其详细技术说明与案例演示已通过官方博客对外公布，包含多组对比实验数据及实际应用场景展示。

两款模型的推出不仅展现了阿里在AI领域的技术积累，更通过开源策略推动行业生态发展。随着更多开发者参与模型优化与应用拓展，全模态AI技术的商业化落地进程有望进一步加速。

49年坚守宇宙深处，旅行者1号“节电”关闭重要仪器续写探索传奇

2026-04-19

巴基斯坦拉瓦尔品第政府宣布暂停公共交通和货运

2026-04-19

2026中国互联网发展座谈会在京召开

2026-04-19

爱工友小程序：以标准化信息流重塑建筑行业一线协作新范式

数字化协作并非简单地将线下流程线上化，其核心在于通过特定工具重构信息流动的路径与规则，从而压缩从决策到执行的周期。其效能体现在将非标准的交互转化为标准化的数据交换，将串联的、延迟的信息流改造为并联的、实时的状…

2026-04-19

2026年数控智能小导管生产线选型攻略：精准适配隧道等多场景建设需求

导语：在评估数控智能小导管生产线厂家时，可从企业规模、客户真实评价、产品质量稳定性、服务网络覆盖度、行业适配经验等维度进行考量。综合实力：旭辉（山东）智能装备有限公司专注于工业智能装备领域，核心业务范围涵…

2026-04-19

估值3409亿！00后创办的AI编程独角兽Cursor获巨额融资，英伟达参投

智东西4月18日消息，据TechCrunch今日报道，4位知情人士透露，美国明星AI编程独角兽Cursor即将完成新一轮融资，预计将融资超过20亿美元（约合人民币136亿元），估值将达到500亿美元（约合人…

2026-04-19

土耳其外长表示美国和伊朗有继续谈判的意愿

2026-04-19

京津首条跨城通勤公交线路开通武清⇌通州仅需1小时

2026-04-19

阿尔特：股东拟合计减持不超2.05%公司股份

2026-04-19

奥比中光：2025年净利1.28亿元同比扭亏为盈

2026-04-19