ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为阿里布局超节点:AI基建转向系统效率,国产算力加速崛起

时间:2025-10-04 12:00:24来源:互联网编辑:快讯

随着人工智能技术加速渗透各领域,行业对算力的需求呈现指数级增长。当AI模型参数规模从亿级攀升至万亿级时,传统单机与集群架构逐渐显露出性能瓶颈,而“超节点”技术正成为突破算力瓶颈的关键方案。这种由数千张GPU通过高速互联技术整合而成的“超级计算节点”,通过优化服务器间通信效率,有效解决了传统架构中带宽不足与延迟过高等问题。

超节点概念最早由英伟达提出,其核心在于将大量计算资源集成于单一逻辑单元。国内科技企业迅速跟进技术迭代,在2025云栖大会上,阿里云推出的磐久128超节点服务器引发关注。该设备搭载自研CIPU 2.0芯片与EIC/MOC高性能网卡,单柜可容纳128个AI计算芯片,在同等算力条件下,推理性能较传统架构提升50%。

在AI训练场景中,超节点技术同样展现强大潜力。华为今年4月发布的CloudMatrix 384超节点,通过构建万片级GPU集群,为万亿参数模型训练提供支撑。在云数据中心环境下,该系统可将432个超节点级联成16万卡规模的超大集群。华为全连接大会披露的数据显示,CloudMatrix 384已交付超300套,服务20余家政企客户,其下一代产品Atlas 950 SuperPoD计划于2026年四季度上市,算力规模达8192卡,2027年推出的Atlas 960 SuperPoD更将突破15488卡。

产业竞争格局正从单卡性能比拼转向系统级效率较量。华龙证券分析指出,中国通过集群建设、开源生态与工程化交付的组合策略,在AI基建领域实现弯道超车。浪潮信息8月发布的元脑SD200服务器,专为万亿参数模型设计;沐曦股份推出的光互连超节点、耀龙3D Mesh超节点等系列产品,覆盖液冷整机柜与高密度算力POD解决方案;百度智能云同期升级的百舸AI计算平台5.0,正式启用昆仑芯超节点架构。

技术演进推动超节点成为AI基础设施新标准。民生证券观察到,市场关注焦点正从芯片算力转向系统级优化。以华为Atlas 950为例,其采用全光互联柜间架构,实现高可靠、低延迟的数据传输;正交架构设计消除线缆电互联,配合独创材料工艺使光模块液冷可靠性提升一倍。对比英伟达2025年下半年推出的NVL144,Atlas 950在卡规模、总算力、内存容量及互联带宽等指标上分别达到前者的56.8倍、6.7倍、15倍和62倍。

超节点技术突破带来新的工程挑战。民生证券指出,随着CloudMatrix 384、英伟达GB200NVL72等设备单机柜功耗突破100KW,温控与供电系统面临严峻考验。华为Atlas 950采用的全液冷方案,有望在提升互联带宽与算力密度的同时,解决高功耗带来的散热难题。该机构测算,液冷技术可使单机柜算力密度提升3-5倍。

资本市场开始关注超节点带来的产业链机遇。国金证券认为,华为等企业推出的新一代平台在关键指标上形成代际领先优势,将加速国产算力基础设施落地。随着超节点渗透率持续提升,光连接、液冷散热等配套供应链有望迎来需求爆发,特别是400G/800G高速光模块与浸没式液冷方案将成为投资热点。

更多热门内容