英特尔酷睿Ultra 200H处理器：120GB显存助力，畅行120B大参数MoE模型-人工智能-ITBear比尔科技

在近日举办的2025英特尔技术创新与产业生态大会上，英特尔面向酷睿Ultra 200H "Arrow Lake-H"系列处理器推出了一系列AI能力升级方案，重点展示了其在大模型本地化部署与显存优化领域的突破性进展。

该系列处理器通过系统架构创新，实现了最高128GB统一内存配置，其中120GB可动态分配为显存资源。这一特性使其能够直接运行参数量达1200亿的混合专家模型（MoE），无需依赖云端算力即可完成本地推理任务。以酷睿Ultra 9 285H平台为例，该型号已实现对Qwen 3-30B-A3B、Qwen 3-Next-80B-A3B等主流MoE架构模型，以及GPT OSS-120B/20B等稠密模型的全面兼容。

针对超大规模模型部署需求，英特尔开发了基于雷电接口的双机集群方案。通过物理连接两台搭载酷睿Ultra 200H的设备，可构建起支持2350亿参数模型本地推理的计算环境。这种分布式架构在保持低延迟的同时，将推理成本较云端方案降低了约40%，特别适合对数据隐私要求严苛的金融、医疗等领域。

在硬件协同优化方面，英特尔与存储厂商Phison联合研发的aiDAPTIV+显存扩充技术成为亮点。该方案通过智能算法动态调整显存分配策略，使模型响应速度提升3倍以上，同时将内存占用率降低60%。测试数据显示，在运行800亿参数模型时，该技术可使单设备推理效率达到主流云服务的85%水平，而功耗仅为后者的三分之一。