阿里巴巴旗下的通义千问今日揭晓了两款全新的小型语言模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,这两款模型在体积上更为紧凑。
通义千问方面透露,在非推理应用场景下,Qwen3-4B-Instruct-2507的表现已经超越了非公开的GPT4.1-Nano模型。而在逻辑推理方面,Qwen3-4B-Thinking-2507更是展现出了惊人的实力,其性能几乎可以与中等规模的Qwen3-30B-A3B(thinking)模型相媲美。
目前,这两款全新的模型已经在魔搭社区以及HuggingFace平台上正式对外开源,供开发者与研究人员免费使用与探索。