ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里Qwen3系列模型或将今日面世,涵盖多尺寸全模态

时间:2025-04-28 21:14:15来源:ITBEAR编辑:快讯团队

近日,阿里巴巴旗下AI领域的重大动态引发了广泛关注。据可靠消息透露,阿里通义千问开源项目的领军人物林俊旸,在某一平台上发布了一条引人遐想的消息,暗示Qwen3系列模型或将于近期面世。

值得注意的是,Qwen3系列模型此前曾在阿里巴巴的AI模型开源社区ModelScope(魔搭)上短暂亮相,随后又悄然下线。这一系列包括了Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B以及Qwen3-30B-A3B-Base四款模型,全部遵循Apache License 2.0开源协议。尽管官方尚未发布正式公告,但通过观察命名规则与前代技术的逻辑,业界对其技术路径和定位方向已有初步推测。

在即将发布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B以参数规模直接命名,分别对应40亿、17亿和6亿参数。这种无后缀的命名方式,或许意味着它们采用的是单架构稠密模型,并未采用混合专家(MoE)设计,更侧重于轻量化应用场景。而Qwen3-30B-A3B-Base则是一款MoE架构的基础模型,其总参数达到300亿(30B),但在处理任务时仅动态调用30亿(3B)参数。

据AIbase的报道,Qwen3系列模型在功能上也颇具亮点,其支持高达256K的上下文长度,能够涵盖推理与非推理任务,这无疑将极大地提升其在各种应用场景下的表现。

回顾过去,自2023年8月以来,阿里云在开源AI模型方面取得了显著进展,相继推出了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,覆盖了从0.5B到110B的全尺寸范围,以及大语言、多模态、数学和代码等全模态领域。这一系列动作不仅展示了阿里云在AI领域的深厚积累,也为其在全球范围内的竞争力注入了新的活力。

更多热门内容
盛科通信:烧钱换增长模式能否借国产替代逆风翻盘?
根据灼识咨询数据,2020年中国商用以太网交换芯片市场以销售额口径统计,博通、美满和瑞昱分别以61.7%、20.0%和16.1%的市占率排名前三位,合计占据了97.8%的市场份额,盛科通信的市占率为1.6%…

2025-04-28

传音控股Q1业绩下滑:净利润4.9亿,降幅近七成
传音控股发布2025年第一季度报告,营业收入130.04亿元,同比下降25.45%;归属于上市公司股东的净利润4.9亿元,同比下降69.87%。业绩变动系受市场竞争以及供应链成本综合影响,营业收入及毛利额减少…

2025-04-28