ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里通义千问新推Qwen3-30B-A3B-Thinking-2507,推理能力全面升级

时间:2025-07-31 09:33:36来源:ITBEAR编辑:快讯团队

近期,Qwen系列模型家族迎来了一位新成员——Qwen3-30B-A3B-Thinking-2507,这一重大更新标志着该系列在智能表现上的又一次飞跃。新版本不仅在体积上保持轻巧,更在推理能力、通用应用及文本处理能力上实现了显著提升。

与早前于4月29日开放的Qwen3-30-A3B相比,新版本Qwen3-30B-A3B-Thinking-2507在多个关键性能测试中展现出了明显优势。在数学领域,新模型在AIME25评测中的得分高达85.0,这一成绩已经超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking),彰显了其卓越的数学解析能力。在编程能力测试中,LiveCodeBench v6的得分同样达到了66.0,进一步证明了新模型在代码理解和生成方面的实力。

不仅如此,Qwen3-30B-A3B-Thinking-2507在知识水平测试中也取得了显著进步,无论是GPQA还是MMLU-Pro评测,都较之前版本有了明显提升。这显示了模型在广泛知识领域的学习和应用能力。

在通用能力方面,新模型同样表现出色。无论是写作评测WritingBench,还是Agent能力测试BFCL-v3,以及多轮对话和多语言指令遵循测试MultiIF,Qwen3-30B-A3B-Thinking-2507均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking),展现了其在自然语言理解和生成方面的强大实力。

新模型的另一大亮点是其上下文理解能力的显著增强。原生支持256K tokens,且可扩展至1M tokens,这一改进使得模型能够处理更长的文本输入,从而更好地理解和生成复杂内容。新模型的思考长度也有所增加,开发者在面对高度复杂的推理任务时,可以通过设置更长的思考预算来充分发挥其潜力。

为了让更多开发者和研究人员受益于这一新版本,Qwen3-30B-A3B-Thinking-2507已经在魔搭社区和HuggingFace平台开放源代码。其轻量级的特性使得模型能够轻松适配消费级硬件,实现本地部署。同时,Qwen Chat也同步上线了新模型,供开发者们亲身体验其强大的推理和生成能力。

更多热门内容
拼多多概念股30日走势分化,主力资金净流出2亿,跨境通领跌
7月30日,拼多多概念下跌0.4%,今日主力资金流出2.03亿元,概念股8只上涨,16只下跌。 主力资金净流出居前的分别为跨境通(1.45亿元)、每日互动(4620.3万元)、兆驰股份(3537.7万元)、东…

2025-07-31