ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里通义千问连发三模,开源推理模型问鼎全球,中国力量改写大模型格局

时间:2025-07-27 06:04:01来源:智东西编辑:快讯团队

近日,阿里巴巴旗下的通义千问团队再次在人工智能领域投下了一枚震撼弹,宣布开源其最新的Qwen3-235B-A22B推理模型升级版——Qwen3-235B-A22B-Thinking-2507。

这款新模型拥有2350亿参数,其中激活参数达到220亿,支持高达256K的上下文长度。在编程、数学、知识推理、人类偏好对齐等多项能力测试中,Qwen3-235B-A22B-Thinking-2507的表现堪比Gemini-2.5 pro和o4-mini等顶尖闭源模型,甚至大幅超越了DeepSeek-R1等开源模型,一举夺得了全球开源模型的最佳性能表现(SOTA)桂冠。

据了解,Qwen3-235B-A22B-Thinking-2507的推出,是通义千问团队积极响应开发者社区反馈的结果。团队在X平台上表示,经过深思熟虑,决定分别训练Instruct和Thinking模型,以获得最佳质量。这一决策迅速得到了开发者的积极响应和高度评价。

事实上,这已经不是通义千问团队近期首次开源重磅模型了。就在一周之内,他们还相继推出了Qwen3-235B-A22B-Instruct-2507基础模型升级版和Qwen3-Coder-480B-A35B-Instruct编程模型。这三款模型在全球权威测评中分别斩获了基础模型、编程模型、推理模型等领域的三项全球开源冠军,展现了通义千问团队的强大研发实力和创新能力。

其中,Qwen3-Coder-480B-A35B-Instruct编程模型更是引发了全球开发者的热烈讨论和高度关注。这款模型拥有480亿参数,激活参数为35亿,原生支持256K上下文长度。借助Qwen3-Coder,开发者可以更加高效地完成编程任务,甚至刚入行的程序员也能在短时间内生成高质量的代码。

Qwen3-235B-A22B-Thinking-2507的发布同样引起了广泛关注。在社交平台上,不少网友分享了这款模型的测评成绩和使用体验,纷纷称赞其“思考模式”名副其实,基准测试成绩令人印象深刻。有开发者表示,这款模型在知识推理、编程能力等方面的表现已经逼近甚至超越了部分顶尖闭源模型,为开发者提供了更加丰富的选择和更强大的支持。

通义千问团队还为这三款最新模型的大规模强化学习训练提供了全新的算法支持——组序列策略优化(GSPO)。相较于传统的强化学习算法,GSPO在稳定性、效率、性能和底层友好度方面均具有显著优势,能够从根本上解决大型MoE模型训练的稳定性问题。

目前,Qwen3-235B-A22B-Thinking-2507已在魔搭社区和Hugging Face平台开源,并采用了极宽松的Apache2.0开源协议,允许用户免费下载和商用。用户还可以通过QwenChat体验这款模型的强大功能。

随着Qwen系列模型的不断开源和升级,通义千问团队正在逐步构建起一个开放、共享、协同的AI生态。这一举措不仅为全球开发者提供了更加丰富的模型选择和更强大的技术支持,也推动了中国开源力量在全球大模型产业格局中的崛起和改写。

更多热门内容