ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为开源超节点架构:以开放之姿,铺就中国AI算力高速发展通途

时间:2025-09-24 00:11:33来源:互联网编辑:快讯

在近期举办的华为全联接大会上,华为凭借一系列创新成果成为焦点,尤其是超节点架构的发布,为AI算力领域带来了革命性突破。此次华为不仅推出了覆盖数据中心到工作站的全场景超节点新品,更以开源开放的姿态,为AI算力生态建设提供了全新思路。

华为此次发布的超节点新品阵容强大,其中Atlas 950 SuperPoD专为超大型AI计算任务设计,实现了从基础器件到光电技术的系统级创新。其采用正交架构,实现了零线缆电互联,液冷接头浮动盲插设计确保零漏液,独创材料和工艺使光模块液冷可靠性提升一倍。创新的UB-Mesh递归直连拓扑网络架构,支持单板内、单板间和机架间的NPU全互联,最大可实现8192卡无收敛全互联,性能远超同类产品。与英伟达计划明年下半年上市的NVL144相比,Atlas 950超节点在规模、总算力、内存容量、互联带宽等方面均具有显著优势,即便对标英伟达2027年计划上市的NVL576,也依然保持领先。

Atlas 850作为业界首个企业级风冷AI超节点服务器,内部搭载8张昇腾NPU,可有效满足企业模型后训练、多场景推理等需求。其支持多柜灵活部署,最大可形成128台1024卡的超节点集群,是目前业内唯一可在风冷机房实现超节点架构的算力集群,企业无需改造现有风冷机房即可部署。

Atlas 350标卡采用最新的昇腾950PR芯片,向量算力提升2倍,支持更细粒度的Cacheline访问,在推荐推理场景可实现2.5倍性能提升,且单卡即可运行。该标卡支持灵衢端口互联,实现算力、内存等资源池化,让更大参数模型、更低时延应用可以在标卡上实现。

TaiShan 950 SuperPoD是华为推出的业界首款通算超节点,具备百纳秒级超低时延、Tb级超大带宽和内存池化能力,能大幅提升数据库、虚机热迁移和大数据场景等业务性能,为通算性能提升开辟全新路径。

在发布超节点新品的同时,华为选择了全面的开放和开源。硬件层面,华为宣布全面开放超节点技术,开放灵衢协议和超节点参考架构,允许产业界基于技术规范自研相关产品或部件。同时,全面开放超节点基础硬件,包括NPU模组、风冷刀片、液冷刀片、AI标卡、CPU主板和级联卡等不同形态的硬件,方便客户和伙伴进行增量开发。

软件层面,操作系统灵衢组件将全部开源,组件代码将陆续合入openEuler等多个上游操作系统开源社区。用户可根据实际需求,将部分或全部源代码集成到现有操作系统中,自行迭代维护版本,也可将整个组件直接合入现有操作系统,未来演进与开源社区版本同步。昇腾CANN全面开源开放,Mind系列组件也同步开源,并支持PyTorch、vLLM等业界开源社区,加速开发者自主创新。

华为之所以选择开源,一方面是为了与产业界、开发者社区基于超节点架构自研相关产品或部件、自定义调试调优、共享技术红利,加速产业协同发展;另一方面,有利于消费者按需取用、降低适配成本,打造面向行业的超节点场景化解决方案。

华为董事、ICT BG CEO杨超斌表示,华为将围绕超节点架构持续创新,让超节点技术不仅用于大型数据中心,也可用于企业级的数据中心和小型工作站。同时,坚持硬件开放,支持各个伙伴灵活打造面向各个行业的超节点场景化解决方案;坚持软件开源,让开发者灵活高效创新,共建繁荣生态。

这意味着超节点技术不再是少数大型数据中心的专属利器,而是一个开放共享的算力生态。每个行业、每个企业、每位开发者都能根据自身需求,灵活搭建自己的算力“高速路”,无论是大型模型训练、复杂推理任务,还是企业级应用场景,用户都能按需获取硬件和软件能力,实现算力资源的高效利用和灵活扩展。

目前,超节点已广泛服务于互联网、金融、运营商、电力、制造等行业,帮助各类企业提升算力效率和业务能力。通过将各个计算单元、存储单元等组件通过大带宽、低时延互联网络平等互联,统一通信协议,省去额外协议转换开销,统一内存编址,实现全局资源池化,使有效算力能够随集群规模线性扩展。同时,通过灵衢协议的高可靠机制,并融入华为在通信上几十年的积累,大幅提升集群可靠性。

随着多芯片互联、大规模计算节点取代单芯片成为行业共识,传统集群通过“服务器堆叠+以太网联接”扩展算力的方式暴露出带宽受限、时延高、效率低、可靠性难以保障等问题。华为以超节点架构为“路基”,通过灵衢互联协议,把分散的服务器深度互联,让集群像一台机器一样学习、推理与协作,为AI大模型和行业应用提供真正高效、稳定、可扩展的算力底座。

灵衢(UnifiedBus)是一个面向超节点的互联协议,依托该协议的超节点架构具备资源池化、线性扩展、长稳可靠等关键特性,实现计算、存储单元的大带宽和低时延互联,解决了传统集群规模上升可靠性降低的痛点。而且灵衢是开源的,协议全面公开,大家可以因地制宜,在不同路况搭建合适的车道,自由开发系统、调度软件,促进生态繁荣。

AI算力生态本质上是“修建数据传输与调度的高速路”。以英伟达的NVLink为例,它像“工业园内部高速”,服务GPU单机或机架内的数据传输,但采用专有协议而相对封闭,编译、传输、通信、驱动等规则均由其独家制定,无法与其他生态互联互通。而华为通过灵衢协议与超节点架构,构建了一套统一标准的“综合交通枢纽”,从卡间互联的“超高速磁悬浮”,到机柜内互联的“城市环线”,再到机柜间互联的“全国高铁网”,均采用同一套协议规则,数据可全程畅通,所有计算、内存、存储资源被打散、池化,系统能自动匹配最高效的调度路径,实现全局资源优化。

华为不仅自己“修路”,还将技术标准向全社会公开,邀请硬件厂商、芯片企业共同参与,按统一标准研发硬件、适配产品,打破“园区式”封闭生态的隔阂,推动整个国产算力生态做大做强。此前,AMD、Intel、Apple等企业发布的开源UALink,虽有类似开放尝试,但受限于软硬件积淀不足,难以支撑大规模扩展的算力网络。

当前,上下文长度和训练数据量激增,模型迭代速度加快、多任务协同与多轮推理、摩尔定律失效,行业对低时延等一系列要求,促使多芯片互联、大规模计算成为必然。而想充分释放百亿亿次计算和万亿参数AI模型的潜力,关键在于服务器集群中每个NPU间能否实现快速、无缝的通信。华为的灵衢协议与超节点架构,为开放硬件与开源软件提供了可行方案,也在真正的可用性上提供了另一种选择。

华为即将上线的Atlas 950超节点、Atlas 960超节点、TaiShan 950超节点以及Atlas 950 SuperCluster 50万卡集群和Atlas 960 SuperCluster,都基于灵衢实现了更大的算力规模、更高的带宽和更低的时延。对比当前全球最大集群xAI Colossus,Atlas 950 SuperCluster的规模是其2.5倍,算力是其1.3倍,堪称全球最强算力集群。Atlas 950超节点较英伟达产品的性能也毫不逊色。

华为以“开放”推动产业普惠,让不同规模、需求的用户都能搭建自己的“AI高速路”,参与全场景算力生态建设,最终实现硬件、软件、算法的共建共赢。对于中国AI算力生态乃至整个AI产业来说,这是一种安全可靠可持续的选择,把AI建设在自己的基座之上,形成AI时代的标准和话语权。而且中国拥有最大的市场,这种生态一旦闭环,将会形成全新的创新飞轮。

更多热门内容
英伟达与OpenAI达成战略伙伴关系,拟投资共建算力超10吉瓦数据中心
一位接近OpenAI的知情人士透露,该协议将促使英伟达最早于2026年底开始交付芯片,协议涉及两笔独立但相互关联的交易。该知情人士表示,OpenAI将以现金方式向英伟达购买芯片,而英伟达则会通过投资获得Op…

2025-09-23

英伟达1000亿美元投资OpenAI,以芯片换股权共筑AI算力新未来
今年早些时候,OpenAI 曾与甲骨文(Oracle)和软银集团宣布,计划在未来四年内投资 5,000 亿美元,建设 10吉瓦的计算能力,当时英伟达是以供应商身份参与其中。在公布本次交易时,英伟达和 Ope…

2025-09-23

华为新专利:AI模型主动预判需求,提升交互效率与用户满意度
天眼查App显示,9月23日,华为技术有限公司申请的“一种模型交互方法、装置、电子设备及交互系统”专利公布。 摘要显示,该专利涉及人工智能技术领域。电子设备中的AI模型提前预判用户需求,并主动输出问题的答案,…

2025-09-23

科大讯飞旗下公司合肥设新企,聚焦AI开发等多项科技服务
来源:慧读财经 天眼查App显示,近日,合肥欢流科技有限公司成立,法定代表人为韩明阳,注册资本200万人民币,经营范围含计算机系统服务、人工智能基础软件开发、人工智能应用软件开发、软件开发、专业设计服务、社会…

2025-09-23

英伟达与OpenAI携手投千亿美元 共建超大规模AI计算基础设施网络
据称,英伟达承诺为该项目提供至多1000亿美元投资,首阶段系统计划于2026年下半年通过英伟达新一代Vera Rubin超级计算平台上线。英伟达与OpenAI计划在未来6周内敲定股权分配、技术共享及数据安全…

2025-09-23

华为云全面升级开发者空间,赋能开发者,共筑AI时代新生态
在9月20日上午举行的大会主题演讲中,华为云全球生态部总裁康宁围绕“成就行业AI先锋,与开发者共赢”主题演讲,详细阐述了华为云生态的最新进展,并宣布华为开发者空间全面升级,全新集成多种AI原生应用开发能力。 …

2025-09-23

英伟达拟1000亿美元投资OpenAI,共建数据中心部署超强算力芯片
一位接近OpenAI的知情人士透露,该协议将促使英伟达最早于2026年底开始交付芯片,协议涉及两笔独立但相互关联的交易。该知情人士表示,OpenAI将以现金方式向英伟达购买芯片,而英伟达则会通过投资获得Op…

2025-09-23

PP-OCRv5破圈引热议:轻量级高精度OCR技术,开启AI大模型专精基建新篇章
这种下载量和Star数的双线并行也恰在顶层印证着PaddleOCR在OCR领域的领先性,即一方面其模型技术底层的算法等逻辑被广大开发者认可、好评,另外一方面下载量和开源项目使用落地趋势的加速也更在证明着Pa…

2025-09-23

网易易盾九载坚守:以AI为盾,于数字浪潮中筑牢安全防线
作为网易公司的安全团队,网易易盾在经过长期的内部锤炼和技术钻研后,于2016年正式对外输出能力与服务,至今已沉淀四大业务,为面向数字化业务的客户提供数字内容风控服务,助力客户安全合规以保障健康、稳定的发展。…

2025-09-23