ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

ClawBench大模型榜单揭晓:智谱字节小米四款模型强势跻身全球前十

时间:2026-03-31 23:04:28来源:天脉网编辑:快讯

评测机构ClawBench近日公布了最新一期全球大型模型排行榜,北京三家人工智能企业的四款模型成功跻身全球前十,展现出中国AI领域的技术实力。其中,智谱科技研发的GLM-5-Turbo以93.9分的成绩登顶榜首,字节跳动旗下的豆包模型Doubao-Seed-2.0-lite紧随其后位列第二,同时凭借最低的使用成本成为全榜单中最具性价比的选择。

小米公司在此次榜单中表现尤为亮眼,其MiMo-V2系列两款模型同时上榜。MiMo-V2-Omni以第九名的成绩入选,在运行速度测试中展现出显著优势;另一款升级版MiMo-V2-Pro虽未进入前十,但在复杂逻辑推理、长指令执行和多轮对话稳定性等专项测试中表现突出,在Model Rank专业排名中位居全球第五。据小米技术团队透露,该模型通过优化注意力机制和知识蒸馏技术,显著提升了长文本处理能力。

在反映企业综合研发实力的LabRank实验室评价体系中,小米同样取得突破性进展。其Text Arena(ArenaExpert)项目位列全球第四,代码生成专项Code Arena排名第五,综合技术实力已跻身国际第一梯队,与Anthropic、OpenAI、谷歌等头部企业形成直接竞争。该评价体系通过模拟真实开发环境,对模型在代码生成、数学推理、多语言处理等20余个维度进行综合评估。

ClawBench榜单的权威性源于其独特的评测机制。关联的Text Arena榜单采用双盲测试模式,所有参与评测的模型均隐藏身份信息,由全球超过5万名真实用户根据回答质量直接投票。这种设计有效避免了针对特定数据集的优化行为,确保评测结果更贴近实际应用场景。据机构负责人介绍,本轮评测共收集有效投票样本超200万份,覆盖金融、医疗、教育等12个专业领域。

更多热门内容
神舟二十一号乘组归途在即 揭秘东风着陆场背后的航天智慧与保障实力
飞船返回的时候再入会产生剧烈的摩擦高温,不过飞船做了很多的防护,乘组是没问题的。最后离地1米,反推发动机点火,会听到“砰”的一声,伴随一下轻微的撞击——这也就意味着,返回舱稳稳地站在了地球的土地上。 返回…

2026-05-31

北京太空智算研究院落地亦庄 聚焦太空算力2028年前将发射首发试验星
研究院将围绕星载算力芯片、星间激光通信、太空能源与散热、天地一体化网络及空间安全标准等方向开展关键共性技术攻关,搭建覆盖技术研发、中试验证、在轨测试到成果转化的全链条服务体系,并计划于2028年前完成首发试验…

2026-05-31

北京太空智算研究院落地亦庄 攻关关键技术 构建太空算力产业生态
IT之家 5 月 30 日消息,据“北京亦庄”官方公众号,近日,北京太空智算研究院在北京经济技术开发区(简称北京经开区,又称北京亦庄)注册成立。 据介绍,研究院将围绕星载算力芯片、星间激光通信、太空能源与散热…

2026-05-31

百度Apollo捐赠自动驾驶车进高校,搭建平台共育未来科技新力量
百度Apollo向北京建筑大学捐赠了自动驾驶车辆,这不仅是技术的传递,更是对未来人才的培养。此次捐赠为教学科研搭建了全新平台,期待以此为契机深化产学研融合,碰撞创新火花,共同推动自动驾驶技术发展与复合型人才培…

2026-05-31

小红书亮相上海网络视听创作者大会:AI赋能创作,共筑真实互动新生态
在《AIGC重塑创作:开启人机共创新生态》主题圆桌中,小红书社区科技人文内容负责人散兵表示,AI正在降低内容创作门槛,也让越来越多普通人拥有表达和创造的能力。多位创作者也在现场分享了他们借助AI进行创作与表…

2026-05-31