ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里新推4B小模型Qwen3,性能超GPT-4.1-nano,端侧部署更友好

时间:2025-08-07 14:42:03来源:智东西编辑:快讯

近日,通义千问在其技术更新中隆重推出了两款全新的小型AI模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507,这两款模型在保持体积小巧的同时,展现出了令人瞩目的性能提升。

据悉,Qwen3-4B系列的新成员在设计上更加注重对复杂场景的适应能力。特别是Qwen3-4B-Thinking-2507,其推理能力几乎可以媲美一些中型模型,这在小型模型中实属罕见。而Qwen3-4B-Instruct-2507则在知识覆盖、逻辑推理、编程技能以及与人类偏好的对齐性等多个方面,全面超越了同类产品GPT-4.1-nano,即便与中等规模的Qwen3-30B-A3B相比也毫不逊色。

这两款新模型不仅在性能上有了显著提升,更重要的是,它们对手机等端侧硬件的友好度大大增强。这意味着,用户将能够在更多场景下,通过轻量级设备享受到AI带来的便利。目前,Qwen3-4B系列模型已经在魔搭社区和Hugging Face平台上正式开源,供开发者们自由使用和探索。

在性能测试方面,Qwen3-4B-Thinking-2507在复杂问题推理、数学运算、代码编写以及多轮函数调用等任务上,均展现出了远超同尺寸模型的能力。而在Arena-Hard v2基准测试中,Qwen3-4B-Instruct-2507更是取得了43.4分的高分,进一步证明了其卓越的性能。

Qwen3-4B-Instruct-2507在知识覆盖面上的表现也尤为突出。它涵盖了更多语言的长尾知识,使得在主观和开放性任务中,其回答能够更加贴近人类的需求和偏好。这种与人类偏好的高度对齐性,无疑将极大地提升用户体验。

Qwen3-4B-Thinking-2507在推理领域的表现同样令人瞩目。在聚焦数学能力的AIME25测评中,它以4B的参数量取得了81.3分的优异成绩,这一成绩甚至可以与一些中型模型相媲美。同时,其通用能力也得到了显著提升,Agent分数甚至超越了更大尺寸的Qwen3-30B-Thinking模型。

更多热门内容
光伏电站监测系统:精准监测气象数据,驱动光伏产业智能升级
随着光伏电站装机容量持续攀升,传统粗放式运维模式难以满足高效、安全、智能的管理需求。在此背景下,光伏电站监测系统应运而生,成为保障电站稳定运行、提升发电效率、实现数字化转型的核心支撑工具。 风途【FT-BGF…

2026-02-24

神龙拜耳平单轴跟踪系统:以智能追踪解锁光伏电站增效新路径
一个真正优秀的设计,是在提升发电性能的同时,通过优化结构、选用耐久材料、简化运维设计,来确保在全生命周期内为客户带来稳定可观的价值增量。 总而言之,在追求光伏电站降本增效的今天,平单轴跟踪系统代表了一种重要…

2026-02-24

4.55亿年前早期植物或已大规模登陆 改写地球表层环境演化史
这些陆地来源的有机质通过河流被输送至海洋,并最终进入海洋沉积物,提高了海洋沉积物中的有机碳/磷比值。对多种可能控制因素的评估表明,这一变化反映的是与早期陆地植物扩张相关的陆地净初级生产力显著增强。综合来看,早…

2026-02-24

OPPO Find N6即将登场!周意保发文预热,折痕优化成最大亮点
CNMO注意到,此条消息是使用OPPO Find N6卫星版发布。此前,周意保发布了一项关于折叠屏用户的调研,吸引了4218人积极参与。这些评价从侧面反映出OPPO Find N6在外观设计、使用体验等方面…

2026-02-24