ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

GLM-5开源登场:从代码模拟到生态闭环,国产AI开启智能体工程新纪元

时间:2026-02-12 20:37:49来源:快讯编辑:快讯

互联网上关于神秘模型“Pony Alpha”的猜测持续发酵一周后,谜底终于揭晓——这款引发诸多讨论的模型,正是智谱 AI 推出的 GLM-5,它被视作智谱 AI 在春节期间放出的“大招”,并且一登场便直接开源,这一举措在 AI 领域引发了广泛关注。

在测试环节,GLM-5 展现出了惊人的能力。当被要求创建一个交互式的 HTML、CSS 和 Java 卫星系统模拟程序,模拟卫星向地面接收器发送信号的过程时,它没有立刻给出代码,而是稍作“停顿”,模拟思考过程后,生成了一个符合要求的 HTML 网页。在这个网页中,卫星不仅围绕地球运行,信号传输还带有符合多普勒效应视觉隐喻的波纹扩散动画,这表明它理解了模拟背后的物理规律,而不仅仅是完成简单的绘图任务。

进一步加大难度,测试人员提出了一个抽象的 Python 任务:可视化展示单行道中交通信号灯的工作原理,车辆以随机速率进入。不到 3 分钟,GLM-5 就生成了一个动态的交通流模拟图。绿灯时车辆放行,红灯时车辆排队,车辆加速减速的随机性也得到了很好的模拟,不过界面设计稍显简陋。

GLM-5 的出色表现吸引了众多网友参与测试。网友 @anurudhsharmaa 仅用一行提示词,就让它生成了一个具有审美感的网站;网友 @zakarinoo7 则生成了一个全功能的媒体播放器,支持 MP4/MP3 解码、播放列表管理,还具备深色模式 UI,编译后仅有 15MB。

在更复杂的测试中,测试人员让 GLM-5 打造一个火柴人开放世界游戏。它没有急于编写代码,而是像人类一样,从技术栈、核心玩法、世界风格等方面逐步对接需求。在开发过程中,测试人员不断提出新的想法,如增加经济系统、动作元素、背包 UI 以及与 NPC 对话功能等,GLM-5 都能一一满足。最终运行效果令人满意,游戏体验尽善尽美。

GLM-5 在系统打造方面也有出色表现。有人让它打造一个 Mac 系统,虽然整体有些粗糙,但经典的屏幕背景、顶部状态栏的时间同步显示以及底部 Dock 栏的图标排列都得以呈现,而且每个应用都能打开。

基准测试结果显示,GLM-5 在 Coding 与 Agent 能力上取得了开源领域的最优表现。在 SWE-bench-Verified 和 Terminal Bench 2.0 这两个公认难度极高的编程榜单中,GLM-5 分别获得了 77.8 和 56.2 的高分,在真实编程场景中的体验已无限接近 Claude Opus 4.5。

GLM-5 之所以能取得如此优异的成绩,得益于其独特的技术架构。它采用了 MoE 架构和异步强化学习(Asynchronous RL),总参数量为 744B,激活参数仅 40B,既聪明又轻量。智谱构建的全新“Slime”框架是其关键所在,以往的模型训练如同“考试”,为拿高分而背题;而 GLM-5 的训练则像“实习”,在 Slime 环境中通过完成一个个完整的长程项目,在反馈和交互中不断学习。它还首次集成了 DeepSeek Sparse Attention(稀疏注意力机制),在处理大量代码上下文时不会“迷路”,还能大幅降低部署成本。

值得注意的是,在官方公告底部的致谢名单中,出现了华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等众多国产芯片企业的名字,这几乎涵盖了中国半导体行业的“半壁江山”。这意味着 GLM-5 的开源不仅是软件层面的突破,更标志着国产 AI 生态从底层芯片算力、中间框架到上层模型,逐渐形成了一个完整的闭环。

更多热门内容
中国移动20亿算力大单落地 指定华为CANN生态引领国产算力新征程
4月12日,观察者网在中国移动采购与招标网看到,中国移动2026-2027年人工智能超节点设备集中采购项目已于4月8日开标,明确指定华为CANN生态,并进行了中标候选人公示。 根据中国移动上个月发布的招标…

2026-04-13

百度伐谋在AI榜单风波中坚守原则 凭Harness Engineering重夺榜首
具体来说,Harness Engineering 是指围绕 AI 智能体设计系统、约束和反馈循环,使其在生产环境中能够可靠运行的工程学科。通过大量实际任务的验证,伐谋证明了一套完整的 AI 智能体架构,不再…

2026-04-13

小红书“黑客松”引“00后”开发者聚首,AI时代构建科技新生态
互联网分析师张书乐曾对《每日经济新闻》记者表示,AI时代,依然是一个创意为先、观点为王的内容大竞赛,小红书的护城河本就是大量创作者基于自身体验下的种草推荐,是原创且实时,并极具个性化。本次举办“黑客松巅峰赛…

2026-04-13

智元酷拓中型四足机器人热销断货,要做有“脑子”的四足机器“人”
然而,面对已有宇树、云深处等重磅玩家的四足市场,智元酷拓董事、COO兼营销服总裁邱恒告诉记者:“做四足机器人根本没有竞争。” 邱恒认为智元是国内拥有数据量最多的机器人公司,人形机器人和四足机器人的感知、理解…

2026-04-13

AI玩具赛道加速升级:摆脱“套壳”局限,智能体引领新体验浪潮
财联社记者采访获悉,当前AI玩具赛道正从“小众尝鲜”走向“大众刚需”阶段,呈现三大核心特点:一是形成了IP版权方、创新厂商(toC消费品公司)、AI技术提供商、玩具设计制造商四足鼎立的竞争格局,但尚未出现垄…

2026-04-13

苹果Vision Pro未凉,无屏智能眼镜N50或2027年登场,AI穿戴再添新兵
首款设备本可让苹果入局增强现实领域,该技术可将数据与图像叠加在现实画面之上;混合现实头显则融合增强现实与虚拟现实技术;最后一款是真正的AR眼镜,一款轻量化设备,无需厚重机身即可为用户提供周边环境信息。这一优…

2026-04-13

红米K90 Max即将登场,散热越级电竞风拉满,3299元起能否成性能机新宠?
先来看最核心的配件方面,根据坊间知情人士的爆料,红米K90Max将搭载一颗天玑9500处理器,不是五代骁龙8至尊版哈--(感觉这颗处理器应该丢给超大杯的红米K90 Ultra了),盲猜至少会配备LPDDR5…

2026-04-13

谷歌Pixel手机语音信箱告别单调!支持自定义问候语 6代及以上机型可用
IT之家 4 月 12 日消息,据科技媒体 Android Authority 今天报道,谷歌现已为 Pixel 系列手机推送语音信箱自定义问候语功能,可以更换掉默认提示语“您拨打的用户暂时无法接听,请在听到…

2026-04-13

红米K90 Max来袭:定位电竞性能强,散热续航双在线,售价引猜测
先来看最核心的配件方面,根据坊间知情人士的爆料,红米K90Max将搭载一颗天玑9500处理器,不是五代骁龙8至尊版哈--(感觉这颗处理器应该丢给超大杯的红米K90 Ultra了),盲猜至少会配备LPDDR5…

2026-04-13

马斯克版“微信”XChat来袭:主打隐私新功能,国行App Store开启预约
现在,马斯克版本的微信终于要来了,官宣将在 4 月 17 日 正式上线首款聊天应用 XChat,马斯克还表示,该应用会和微信一样强大好用。上月初,马斯克旗下的 X 平台曾悄悄在苹果 TestFlight …

2026-04-13