ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里Qwen2.5逆袭登顶!全球开源大模型新霸主诞生,Meta也败下阵来?

时间:2024-09-19 17:06:54来源:ITBEAR编辑:瑞雪

【ITBEAR】9月19日消息,在9月19日的云栖大会上,阿里云CTO周靖人重磅发布了通义千问的新一代开源模型Qwen2.5。这款旗舰模型Qwen2.5-72B在性能上成功超越了拥有4050亿参数的Llama 405B,再次登顶全球开源大模型的宝座。

Qwen2.5-72B在MMLU-redux等十多个基准测评中表现超越Llama3.1-405B

据ITBEAR了解,Qwen2.5全系列涵盖了多种尺寸的大语言模型、多模态模型、数学模型以及代码模型,且每个尺寸都提供了基础版本、指令跟随版本及量化版本,总计推出了100多个模型,这一数字刷新了业界的纪录。这些模型在18T tokens的数据上进行了预训练,相较于Qwen2,Qwen2.5的整体性能有了18%以上的显著提升。

在具体能力方面,Qwen2.5-72B模型在MMLU-rudex基准、MBPP基准以及MATH基准上的得分分别高达86.8、88.2和83.1,展示了其在通用知识、代码能力和数学能力方面的强劲实力。此外,该模型还支持高达128K的上下文长度,并能生成最多8K的内容。值得一提的是,Qwen2.5还具备强大的多语言能力,支持包括中文、英文、法文等在内的29种以上语言。

在模型尺寸方面,Qwen2.5开源了7个不同尺寸的模型,从0.5B到72B,这些模型在同等参数规模下都创造了业界的最佳成绩。特别地,3B尺寸的模型被视为适配手机等端侧设备的理想选择;而32B尺寸的模型则因其出色的性价比而备受开发者期待,它在性能和功耗之间达到了优异的平衡。

HuggingFace数据显示,截至9月中旬Qwen系列原生模型和衍生模型总数超过5万个

在专项模型领域,Qwen2.5也取得了显著进展。用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math相较于前代模型都有了实质性的提升。特别是Qwen2.5-Math,它支持使用中英双语的思维链和工具集成推理来解决数学问题,被誉为迄今为止最先进的开源数学模型系列。

此外,在多模态模型方面,备受瞩目的视觉语言模型Qwen2-VL-72B也正式开源。这款模型能够识别不同分辨率和长宽比的图片,理解超过20分钟的长视频内容,并具备了操作手机和机器人的视觉智能体能力。在最近的权威测评中,Qwen2-VL-72B成功摘得了全球得分最高的开源视觉理解模型的桂冠。

自2023年8月开源以来,通义千问在全球开源大模型领域的地位日益凸显,已逐渐成为开发者们的首选模型。其卓越的性能和不断丰富的生态网络为其赢得了广泛的赞誉和关注。

关键词:#通义千问# #Qwen2.5# #开源模型# #全球领先# #多模态能力#

更多热门内容
全新GL8陆尊来袭,26.99万起售!豪华MPV市场再添猛将
着眼于高端用户的智慧出行需求,全新GL8陆尊搭载全新一代VCS智能座舱,拥有EYEMAX30吋一体弧面6K屏、高通骁龙8155芯片以及5G通信技术等同级领先配备的加持,为用户带来沉浸式感官享受和精准流畅的交互…

2024-10-31

讯飞星火助力科研飞跃,AI for Science引领科技革新浪潮!
他认为,人工智能赋能科研工作有三个台阶,一是借助科研文献助手和代码助手提升基础工作效率,二是基于深度神经网络对科学任务进行精准建模,三是借助认知大模型学习领域知识并辅助设计科研实验方案。 在今年的科大讯飞全球…

2024-10-31