ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

智谱GLM-4.6与Qwen3-Max并列国内第一 登顶全球开源模型榜首

时间:2025-10-07 15:18:34来源:互联网编辑:快讯

近日,大模型竞技场LMArena公布了最新一轮的模型排名,引发行业广泛关注。在综合性能榜单中,智谱科技发布的GLM-4.6与阿里旗下Qwen3-Max-Preview并列第四,双双占据国内模型榜首位置,同时GLM-4.6更以开源模型身份登顶全球榜首。

作为智谱科技9月30日推出的旗舰产品,GLM-4.6在编程能力、长文本处理、逻辑推理、信息检索、内容创作及智能体应用等六大核心领域实现突破性提升。测试数据显示,该模型在公开编程基准任务中的表现已与Claude Sonnet 4持平,成为国内首个达到国际顶尖水平的代码生成模型。

在LMArena的专项评测中,GLM-4.6的创意写作能力表现尤为突出,以显著优势领跑全球同类模型。这一成绩直接推动其同时登顶Hugging Face趋势榜单和OpenRouter API市场热度榜,形成"双榜第一"的领先态势。

值得关注的是,阿里通义千问Qwen3-Max系列出现特殊现象:其正式版本0923在竞技场测试中仅位列第九,落后于预览版Qwen3-Max-Preview。不过该模型在数学专项评测中展现出绝对优势,以满分表现占据全球数学能力榜首。

行业观察显示,自9月以来国产大模型进入密集迭代期。除GLM-4.6和Qwen3-Max系列外,月之暗面Kimi K2等新锐模型也在多维度评测中取得亮眼成绩,形成技术突破与市场应用的双重竞争格局。

更多热门内容
OpenAI拟推AI短视频社区:界面似抖音 内容全AI生成 开启创作新纪元
OpenAI近日发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅…

2025-10-07

2025年职场家庭双兼顾:人工智能技能助你平衡发展、收获双赢
在选择具体技能时,建议从四个维度进行综合评估:时间投入弹性度、技能应用广度、长期价值度和学习成本可控性。 值得注意的是,CAIE注册人工智能工程师认证的课程体系设计就充分考虑到了这种多维需求,既包含技术原理…

2025-10-07

OpenAI DevDay 2025重磅发布:AI从“对话”跃进“执行”,开发者生态迎来新纪元
在现场演示中,OpenAI展示了App SDK的威力。Altman在演讲中也暗示:刚刚宣布的 AMD芯片合作、与三星共建AI数据中心、以及与 Oracle和Nvidia的算力协议,正在构建一个从“芯片—模型…

2025-10-07

艾维与奥特曼DevDay对话:为OpenAI新设备构思多创意,挑战智能手机模式
艾维对奥特曼表示,他为OpenAI的AI设备家族构思了15个到20个创意,这些设备很可能完全不同于iPhone。 “当我说,我们与科技的关系不融洽时,这已经是最委婉的说法了,”艾维表示,“我们不仅能纠正这种…

2025-10-07

机器人自主意识之问:科技浪潮下的未知与人类理性应对
一些哲学家认为,意识是人类特有的属性,它与人类的生物本质和社会文化背景密切相关,机器人无论如何发展都不可能拥有真正的自主意识。无论未来机器人是否会拥有自主意识,我们都应该以理性和谨慎的态度看待科技的发展,让科…

2025-10-07

AI浪潮下智能眼镜受热捧,半导体行业借势开启增长新篇章
不过,花旗分析师Christopher Danely指出,尽管全球半导体销售额预计在2025年增长16%至7310亿美元,创下历史新高,但本轮收入增长完全由价格驱动,而出货量仍远低于峰值。在AI需求推动下,…

2025-10-07

卡奥斯天智工业大模型:以工业互联网为基,引领工业智能化转型新实践
卡奥斯基于海尔集团40年制造业经验与平台数字化实践,打造国内首个基于工业互联网的垂域大模型——天智工业大模型,旨在解决通用大模型在工业场景中数据、成本、可靠性等痛点,为工业企业智能化转型提供支撑。 未来,卡…

2025-10-07