ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Agentic AI浪潮下,华为以软硬件协同创新构建国产算力新范式

时间:2026-05-24 03:41:04来源:互联网编辑:快讯

随着OpenClaw、Hermes等智能体推动AI从对话交互向任务执行转型,相关应用的Token消耗量在半年内增长至原来的6倍,Agentic AI引发的算力需求重构正在重塑整个产业格局。面对这一趋势,华为在鲲鹏昇腾开发者大会上提出了系统性解决方案,从芯片架构到软件生态构建了多层次技术体系。

华为半导体首席科学家廖恒指出,Agentic AI时代对AI芯片提出了差异化需求。在预训练、推理Prefill与Decode等不同业务场景中,算力、内存带宽、内存容量和互联IO带宽四大核心指标的优先级存在显著差异。其中,芯片互联能力直接决定了超节点的计算效能上限,这成为突破算力瓶颈的关键突破口。

昇腾950芯片通过架构创新实现了超节点性能跃升。该芯片采用新型互联技术,构建出带宽更高、延迟更低、覆盖范围更广的节点网络,使系统综合性能达到超节点规模与单芯片性能的乘积效应。这种深度协同设计贯穿芯片架构、系统架构、集群架构和软件架构四个维度,配合CANN基础软件的持续优化,在保持生态兼容性的同时显著提升了运行效率。

在软件生态建设方面,华为全面开源CANN计算架构,为开发者提供完整的算子开发工具链。通过实现Triton和TileLang编程接口的100%兼容,将算子开发周期压缩至一周以内。目前该平台已支持超过600个Triton算子和300个TileLang算子,覆盖主流模型的关键计算单元。北京大学研究团队证实,TileLang框架在DeepSeek V4模型推理中展现出显著优势,验证了昇腾平台对前沿模型的技术支撑能力。

通用计算领域正在经历范式转变。华为ICT操作系统专家胡欣蔚透露,鲲鹏计算架构正从单一模型训练场景向Agent负载优化转型,构建起包含基础硬件、异构融合层和智能调度层的三层体系。这种设计实现了智能计算与通用计算的软硬协同,为大规模智能体部署提供了算力保障。

针对Agent应用的特殊需求,鲲鹏超节点创新采用多级缓存共享架构,结合增量快照共享和快速状态分叉技术,将任务回滚延迟控制在十毫秒级别。实验数据显示,这种设计使Agent任务成功率提升超过10%。在通信加速方面,灵衢SGL特性降低20%网络延迟,透明UBSocket技术实现应用无感知的时延优化,共享TP技术则减少90%的通信内存占用。

性能优化延伸至存储和检索环节。通过共享内存实现的Buffer Pool预热机制,配合分布式全局图索引技术,使多模态检索效率提升一倍。上下文缓存技术的应用则减少50%的Token重复消耗,显著降低了智能体运行的资源开销。这些技术创新共同构建起高密度、低延迟、高并发的沙箱基础设施,为Agent生态发展奠定技术基石。

更多热门内容
vivo Y600 Turbo 5月25日预售来袭,性能续航屏幕亮点多,中端机新选择
还有子品牌的iQOO 15T,同样在5月份发布,倾向于游戏手机市场,而且是旗舰级别。屏幕整体性能可达中高端级别,其中刷新率、护眼等方面重点提升。 从整体上,新机重点在性能、屏幕、续航方面,其它配置均为常规升级…

2026-05-24

BHW手持式氧化锌避雷器综合测试仪:精准诊断,便携高效守护电网安全
通过精确测量全电流和阻性基波,能灵敏发现内部绝缘受潮与阀片老化,是实现状态检修的得力装置。正常氧化锌避雷器在运行电压下主要流过容性电流,当受潮或阀片老化时,阻性电流分量显著增加。 电压采集器集成128×64…

2026-05-24

携号转网用户破6000万:资费、体验还是消费觉醒?普通人用选择改写通信规则
前几天吃饭,隔壁桌两个人聊得挺大声,一个说自己用了快10年的号码,前阵子终于转网了,原本还担心麻烦,结果办完才发现,折腾他的不是流程,是之前一直没下决心。这种变化背后,绝不是一句“用户变精了”就能说完的,里面…

2026-05-24

2026旗舰手机怎么挑?华为vivoOPPO三款热门机型全方位对比来啦
相比vivoX300Ultra和OPPOFindX9sPro,华为Pura90系列在影像智能化(AI姿势推荐、假日色卡)、系统流畅度(鸿蒙6.1+超空间内存)、续航(6500mAh+100W双快充)、颜值(…

2026-05-24

本周基建航天等多领域捷报频传 中国科技硬核实力持续彰显
5月19日,中欧联合研制的“微笑”卫星成功发射升空,将实现人类首次对地球磁层的软X射线整体成像,为提升空间天气预报能力、保障航天和通信导航活动等提供核心科学支撑。 作为中国科学院空间科学二期先导专项的收官之…

2026-05-24