ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

云天励飞“All in”大算力推理芯片,以GPNPU架构开启AI普惠新征程

时间:2026-02-04 11:00:17来源:快讯编辑:快讯

在人工智能从“基础模型构建”向“规模化应用落地”转型的关键节点,云天励飞近日举办“大算力芯片战略前瞻会”,正式公布未来三年大算力AI推理芯片的战略布局。公司宣布将集中核心研发资源突破大模型落地的“成本壁垒”,通过底层架构创新实现百万Tokens推理成本降低超100倍的目标,推动AI技术从实验室走向普惠化生产场景。

全球算力产业重心正加速向推理侧倾斜。谷歌2025年4月发布的第七代TPU“Ironwood”明确定位为“推理时代基石”,重点优化大规模推理能效;英伟达同年12月斥资200亿美元与推理芯片厂商Groq达成非独占许可协议,吸纳其核心团队强化实时工作负载能力。行业信号显示,推理竞争已从“参数规模”转向“单位成本与交付效率”,能效比成为规模化落地的核心门槛。

云天励飞提出GPNPU技术路线,以“GPNPU = GPGPU + NPU + 3D堆叠存储”公式重构芯片架构。该路线通过兼容CUDA生态实现一行代码迁移,降低企业应用门槛;采用NPU专用化设计提升能效比,针对大模型推理的结构化负载优化成本;研发3D堆叠存储技术突破“内存墙”瓶颈,降低推理时延。公司CTO李爱军强调,架构创新需兼顾通用性与专用性,在工程层面解决可迁移、可部署、可持续降本三大难题。

在产品化路径上,云天励飞推出“算力积木”架构,通过Chiplet技术实现算力模块化扩展,支持从边缘设备到千卡集群的弹性部署。公司拒绝单纯堆砌芯片参数,转而围绕真实业务负载进行系统级优化,逐项击穿推理链路中的成本与时延瓶颈。目前,其政企事业部已启动区域级“千卡集群”建设,旨在树立城市AI算力赋能标杆。

支撑战略落地的核心在于五大要素协同:技术层面,公司聚焦AI大算力推理芯片研发;产能层面,其国产供应链储备为大规模量产提供确定性;生态层面,四大事业部覆盖研发、优化到推广的全链条;市场层面,政企事业部主导推理设备与智算中心建设;资本层面,市值突破万亿元的愿景彰显长期信心。董事长陈宁特别指出,供应链安全是当前行业竞争的关键变量,云天励飞已构建起抵御外部风险的护城河。

根据规划,云天励飞未来三年将梯度推进DeepVerse芯片研发,对标国际主流平台优化长上下文预填充、低时延解码等关键环节。2028年产品将采用PD分离、AFN分离及超节点架构设计,性能指标有望比肩英伟达Rubin架构。公司强调,推理时代的竞争本质是“单位推理成本”之争,唯有将技术做得足够便宜、稳定、易用,才能推动AI从“能力展示”转向“生产力工具”。

更多热门内容
WPS背刺6.78亿用户 章庆元挖的坑雷军知道吗?
国产办公软件走到今天,WPS 是绕不开的标杆。它靠着免费门槛拿下海量用户,稳稳守住国内办公软件半壁江山。但六月下旬,大量用户集中吐槽两个核心问题,直接把品牌口碑拉到低点。软件后台持续往 C 盘写入缓存备份文件,动辄占用几十 GB 空间,电脑系统盘频繁爆满卡顿。

2026-06-29

华为鸿蒙Harmony OS装机量突破7000万台
第三方统计平台奇妙工具箱最新监测数据显示,华为鸿蒙HarmonyOS国内智能手机装机量已正式突破7000万台,目前实时统计数据达到7010.18万台。这意味着鸿蒙距离智能手机装机量突破1亿台的目标又迈出了关键一步。据了解,在6月12日举行的华为开发者大会(HDC 2026)上,华为常

2026-06-29

百度昆仑芯冲刺港股IPO,估值500亿美元
6月29日,百度集团港股股价盘中走强,一度涨超8%。消息面上,据媒体援引知情人士报道,百度旗下AI芯片公司昆仑芯正推进赴港上市计划,目标估值约500亿美元(约合人民币3400亿元)。知情人士透露,腾讯目前已成为昆仑芯客户,字节跳动也正在考虑采用其AI芯片。不过,对于上

2026-06-29

联想中国基础设施业务服务器预期上调,明年两大客户交付或破2000亿
联想集团近期在服务器业务领域动作频频,引发市场高度关注。据内部知情人士透露,联想中国基础设施业务团队已对服务器业务增长预期作出重大调整,上调幅度显著超出此前规划。该集团曾于公开场合宣布,计划在2027/2028财年实现服务器业务营收突破千亿元大关。然而根据当

2026-06-29

中国移动设立Token办公室,集团领导挂帅
6月29日消息,据 C114通讯网消息,据业内消息,中国移动于近日正式设立 Token 办公室,该部门为集团级战略机构,级别高于此前成立的算力办公室,由集团核心领导直接挂帅督战,战略发展部总经理出任 Token 办公室常务副主任。

2026-06-29