ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里通义千问推出Qwen3-4B系列小模型,性能媲美甚至超越部分大模型

时间:2025-08-07 16:03:07来源:ITBEAR编辑:快讯团队

阿里巴巴旗下的通义千问今日揭晓了两款全新的小型语言模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,这两款模型在体积上更为紧凑。

通义千问方面透露,在非推理应用场景下,Qwen3-4B-Instruct-2507的表现已经超越了非公开的GPT4.1-Nano模型。而在逻辑推理方面,Qwen3-4B-Thinking-2507更是展现出了惊人的实力,其性能几乎可以与中等规模的Qwen3-30B-A3B(thinking)模型相媲美。

目前,这两款全新的模型已经在魔搭社区以及HuggingFace平台上正式对外开源,供开发者与研究人员免费使用与探索。

更多热门内容