ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谁说国产AI不行了?清华大模型报告最新评测出炉!

时间:2024-04-24 21:25:27来源:互联网编辑:汪淼

由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多能力全球第一。

图片

评测显示,文心一言4.0表现优异,在中文推理、中文语言等评测上遥遥领先,和其他模型拉开明显差距。中文理解上,文心一言4.0领先优势明显,领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。

在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上,国内模型文心一言4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。

更多热门内容
倒计时2天,2024中国移动算力网络大会展区升级亮相
算力网络创新成果如何释放产业创新数智力量带来经济社会数字化发展新图景?4月28-29日2024中国移动算力网络大会主题展区超长剧透将为你揭秘!超大规模数智展区,体验感拉满!今年大会展区全新启航,规格更高、规模更大,将启用8000㎡超大展区,并设中国移动及合作伙伴两大

2024-04-27

2024年客厅投影仪买哪款好?当贝X5S搭载超级灵动云台白天也能用
如果说客厅娱乐设备是选择电视还是投影仪,那么2024年已经有了非常明确的结论,选投影仪才是更推荐更值得买的。现在很多投影仪越来越卷,在同价位下更是有白天都能看的亮度和全新的云台加持。那么如今客厅投影仪怎么选,哪个牌子好?或许这篇文章可以告诉你答案!一、2024

2024-04-26

中兴通讯亮相CCBN2024,筑牢“连接+算力”数字基础设施
日前,中兴通讯亮相第三十届中国国际广播电视信息网络展览会,全面展示5G-A网络建设及应用创新方案、通算/智算/大模型等全栈智算方案、智慧家庭创新产品以及丰富多彩的云电脑、个人终端等产品。中兴通讯凭借技术优势,在方案创新、产品性能、售后服务等方面业界领先,能够为

2024-04-26