ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英特尔酷睿Ultra 200H处理器:120GB显存助力,畅行120B大参数MoE模型

时间:2025-11-22 05:12:44来源:快讯编辑:快讯

在近日举办的2025英特尔技术创新与产业生态大会上,英特尔面向酷睿Ultra 200H "Arrow Lake-H"系列处理器推出了一系列AI能力升级方案,重点展示了其在大模型本地化部署与显存优化领域的突破性进展。

该系列处理器通过系统架构创新,实现了最高128GB统一内存配置,其中120GB可动态分配为显存资源。这一特性使其能够直接运行参数量达1200亿的混合专家模型(MoE),无需依赖云端算力即可完成本地推理任务。以酷睿Ultra 9 285H平台为例,该型号已实现对Qwen 3-30B-A3B、Qwen 3-Next-80B-A3B等主流MoE架构模型,以及GPT OSS-120B/20B等稠密模型的全面兼容。

针对超大规模模型部署需求,英特尔开发了基于雷电接口的双机集群方案。通过物理连接两台搭载酷睿Ultra 200H的设备,可构建起支持2350亿参数模型本地推理的计算环境。这种分布式架构在保持低延迟的同时,将推理成本较云端方案降低了约40%,特别适合对数据隐私要求严苛的金融、医疗等领域。

在硬件协同优化方面,英特尔与存储厂商Phison联合研发的aiDAPTIV+显存扩充技术成为亮点。该方案通过智能算法动态调整显存分配策略,使模型响应速度提升3倍以上,同时将内存占用率降低60%。测试数据显示,在运行800亿参数模型时,该技术可使单设备推理效率达到主流云服务的85%水平,而功耗仅为后者的三分之一。

更多热门内容
苹果UniGen 1.5模型:图像理解生成编辑一肩挑,创新突破引关注
12 月 19 日消息,科技媒体 9to5Mac 昨日(12 月 18 日)发布博文,报道称苹果研究团队近日发布多模态 AI 模型 UniGen 1.5,成功在单一系统中集成了图像理解、生成与编辑三大核心功能…

2025-12-20

中科曙光scaleX万卡超集群亮相,多项创新突破引领AI算力新高度
通过“超级隧道”、AI数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,使存力平台高效应对大模型训练时万卡并发读写带宽极致需求挑战,提升高通量AI推理时的响应速度与结果精准度,并可将AI加速…

2025-12-20