ITBEAR科技资讯

网站首页科技资讯财经资讯分享好友

阿里通义千问推出Qwen3-4B系列小模型，性能媲美甚至超越部分大模型

时间：2025-08-07 16:03:07来源：ITBEAR编辑：快讯团队

阿里巴巴旗下的通义千问今日揭晓了两款全新的小型语言模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507，这两款模型在体积上更为紧凑。

通义千问方面透露，在非推理应用场景下，Qwen3-4B-Instruct-2507的表现已经超越了非公开的GPT4.1-Nano模型。而在逻辑推理方面，Qwen3-4B-Thinking-2507更是展现出了惊人的实力，其性能几乎可以与中等规模的Qwen3-30B-A3B(thinking)模型相媲美。

目前，这两款全新的模型已经在魔搭社区以及HuggingFace平台上正式对外开源，供开发者与研究人员免费使用与探索。

更多热门内容

罗马仕创新折叠移动电源专利获批，提升强度与散热性能

2025-08-07

东北雨姐丈夫白国辉近期连续注销多家实控公司

2025-08-07

理想汽车新专利：防撞梁内置储气腔减重又增强抗变形能力

2025-08-07

永安行工商变更，杨磊接任法人，注册资本增加并拓展AI业务范畴

2025-08-07

丰田汽车Q1销售净额增3.5%，净利润降37%至8413.5亿日元

2025-08-07

小红书发布dots.vlm1视觉语言模型，准SOTA水平引领技术新潮流

2025-08-07

广汽商贸注册资本增至43.2亿，闫建明卸任法人由李勇接任

2025-08-07

灵心巧手获数亿天使轮融资，蚂蚁集团领投加速灵巧手技术落地

2025-08-07

重庆“萝卜快跑”无人网约车发生意外坠入施工沟槽女乘客获救

2025-08-07

小红书进军二次元：漫展热潮下的挑战与机遇
2025-08-07