ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Qwen新版模型发布:30亿参数媲美GPT-4o,消费级GPU即可运行

时间:2025-07-30 14:21:54来源:机器之心Pro编辑:快讯团队

在AI领域,Qwen再次以惊人的速度推出了其最新力作。继此前三款AI大模型的面世后,Qwen于凌晨时分悄然更新了其Qwen3-30B-A3B模型,新版本被命名为Qwen3-30B-A3B-Instruct-2507。

这一新版本的最大亮点在于其非思考模式下的卓越表现。仅需激活30亿参数,它便能与业界顶尖的闭源模型,如谷歌的Gemini 2.5-Flash(非思考模式)和OpenAI的GPT-4o相抗衡,这无疑在模型效率和性能优化方面取得了重大突破。

从性能数据来看,新版本在多项测试中均实现了显著提升。例如,AIME25的得分从之前的21.6跃升至61.3,Arena-Hard v2的得分也从24.8大幅提升至69.0。在与DeepSeek-V3-0324等模型的性能对比中,新版本模型也展现出了强大的竞争力,甚至在某些基准测试中超越了对手。

Qwen3-30B-A3B-Instruct-2507在多个方面实现了关键提升。其通用能力,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面均得到了大幅提升。同时,模型在多语言的长尾知识覆盖方面也取得了显著进步。在主观和开放任务中,新模型与用户偏好的对齐更加紧密,能够生成更高质量的文本,为用户提供更有价值的回答。其长文本理解能力也提升至256K。

目前,该模型已在魔搭社区和HuggingFace等平台开源,用户可以在QwenChat上直接体验。这一开源举措迅速得到了社区的支持,模型的使用渠道不断拓宽,甚至出现了量化版本。这一新模型的出现,使得消费级GPU运行AI模型成为了可能,不少用户已经晒出了在Mac电脑、搭载RTX 3090的PC等设备上的运行体验。

值得注意的是,尽管新版本模型在性能上取得了显著提升,但它仍然是一个非推理模型。有开发者将其与具备推理能力的模型进行了对比,发现对于生成复杂代码这类任务,模型的推理能力可能是一个关键因素。尽管如此,Qwen团队的这次更新仍然让业界为之震动,每天醒来都能看到AI能力的新进展,这无疑是一件令人兴奋的事情。

更多热门内容