Qwen新版模型发布：30亿参数媲美GPT-4o，消费级GPU即可运行-信息流-ITBear科技资讯

在AI领域，Qwen再次以惊人的速度推出了其最新力作。继此前三款AI大模型的面世后，Qwen于凌晨时分悄然更新了其Qwen3-30B-A3B模型，新版本被命名为Qwen3-30B-A3B-Instruct-2507。

这一新版本的最大亮点在于其非思考模式下的卓越表现。仅需激活30亿参数，它便能与业界顶尖的闭源模型，如谷歌的Gemini 2.5-Flash（非思考模式）和OpenAI的GPT-4o相抗衡，这无疑在模型效率和性能优化方面取得了重大突破。

从性能数据来看，新版本在多项测试中均实现了显著提升。例如，AIME25的得分从之前的21.6跃升至61.3，Arena-Hard v2的得分也从24.8大幅提升至69.0。在与DeepSeek-V3-0324等模型的性能对比中，新版本模型也展现出了强大的竞争力，甚至在某些基准测试中超越了对手。

Qwen3-30B-A3B-Instruct-2507在多个方面实现了关键提升。其通用能力，包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面均得到了大幅提升。同时，模型在多语言的长尾知识覆盖方面也取得了显著进步。在主观和开放任务中，新模型与用户偏好的对齐更加紧密，能够生成更高质量的文本，为用户提供更有价值的回答。其长文本理解能力也提升至256K。

目前，该模型已在魔搭社区和HuggingFace等平台开源，用户可以在QwenChat上直接体验。这一开源举措迅速得到了社区的支持，模型的使用渠道不断拓宽，甚至出现了量化版本。这一新模型的出现，使得消费级GPU运行AI模型成为了可能，不少用户已经晒出了在Mac电脑、搭载RTX 3090的PC等设备上的运行体验。

值得注意的是，尽管新版本模型在性能上取得了显著提升，但它仍然是一个非推理模型。有开发者将其与具备推理能力的模型进行了对比，发现对于生成复杂代码这类任务，模型的推理能力可能是一个关键因素。尽管如此，Qwen团队的这次更新仍然让业界为之震动，每天醒来都能看到AI能力的新进展，这无疑是一件令人兴奋的事情。