ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里千问3开源:小体积大智慧,4张H20满血部署

时间:2025-04-29 08:30:07来源:ITBEAR编辑:快讯团队

阿里巴巴于近日正式推出了其通义千问系列的最新成员——Qwen3模型,这一创新成果在凌晨时分悄然亮相,引起了业界的广泛关注。据悉,Qwen3的参数量仅为DeepSeek-R1的三分之一,这一显著的成本降低无疑为其广泛应用铺平了道路。

Qwen3被定位为“混合推理模型”,这一独特定位意味着它融合了“快思考”与“慢思考”的双重能力。对于简单直接的查询,Qwen3能够迅速响应,以低算力提供即时答案;而面对复杂问题,它则能进行多步骤的深入推理,有效节省了算力资源。

作为Qwen系列的新一代代表,Qwen3在多个权威评测中展现出了卓越的性能。无论是GPQA、AIME24/25还是LiveCodeBench,Qwen3都取得了极具竞争力的成绩,充分证明了其强大的推理能力。

尤为在相同的计算资源条件下,Qwen3凭借其较小的规模成功超越了上一代更大体量的模型,真正实现了“小而强大”的目标。这一成就不仅彰显了阿里巴巴在人工智能领域的深厚积累,也为未来模型的小型化、高效化提供了有益的参考。

Qwen3的总参数量达到了235B,这一数字刷新了开源模型的智能水平新高。阿里巴巴方面表示,仅需4张H20显卡即可部署Qwen3的满血版,而且其显存占用仅为性能相近模型的三分之一。这一优势无疑将大大降低模型的部署门槛,推动其在更多场景下的应用。

为了满足不同用户的需求,Qwen3模型版本涵盖了多款不同规模的模型。其中包括2款30B和235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。这些多样化的选择将使得Qwen3能够更灵活地适应各种应用场景,满足不同用户的实际需求。

更多热门内容
OpenAI新动向:ChatGPT将添购物功能,用户可查询信息后跳转商家网站
据报道,OpenAI当地时间4月28日宣布将在其人工智能聊天助手ChatGPT中测试推出购物功能,用户将能够通过ChatGPT查询购物信息,ChatGPT将根据查询结果生成产品卡。购物者将不在ChatGPT内…

2025-04-29