二手硬件显神威：6根傲腾内存助力单GPU工作站运行万亿参数大模型-人工智能-ITBear科技资讯

近日，科技领域传来一则引人注目的消息：一名Reddit用户APFrisco凭借独特的硬件组合与软件优化方案，在单GPU工作站上成功运行了参数规模达1万亿的Kimi K2.5大模型，推理速度稳定在每秒4个Token。这一成果为高参数模型在有限硬件环境下的部署提供了新思路。

该系统的核心硬件配置颇具特色。处理器采用英特尔至强金牌6246，搭配泰安S5630GMRE-CGN主板构建计算平台。内存系统由两部分组成：6根32GB三星DDR4-2666 ECC内存条提供基础内存容量，6根128GB英特尔傲腾DCPMM持久内存模块则作为扩展存储，两者协同工作使总内存容量达到768GB。图形处理任务由两张华硕GeForce RTX 3060 OC 12GB显卡共同承担，存储设备选用西部数据WD SN850X 2TB固态硬盘，电源系统采用华擎Steel Legend SL-850G 850W全模组电源确保稳定供电。

软件层面的优化是该方案的关键突破。研发团队基于llama.cpp框架开发了GPU与CPU混合推理方法，通过设置override-tensor标志，将模型路由组件强制分配至GPU显存处理。由于两张显卡共提供24GB显存，系统巧妙地将核心计算任务集中于此，而将剩余参数存储于傲腾内存模块中。这种设计有效解决了单卡显存容量不足的瓶颈问题，使大规模模型能够在消费级硬件上运行。

英特尔傲腾系列产品的技术特性在此方案中发挥重要作用。尽管该产品线已停止生产，但其独特的持久化内存特性——读写速度介于传统DRAM与固态硬盘之间——使其成为替代高成本内存方案的理想选择。傲腾模块不仅能够提供大容量存储空间，还能保持相对较高的数据访问速度，这种中间层特性恰好满足了大模型推理过程中对内存容量与速度的双重需求。

行业观察人士指出，随着CXL计算快速连接标准的逐步成熟，内存架构将迎来新的发展机遇。这项标准通过统一内存访问接口，能够实现CPU、GPU与加速卡之间的内存池化共享，为构建高性价比的大容量内存解决方案提供技术基础。未来，这类技术有望缓解大型语言模型训练与推理过程中对内存容量的迫切需求，推动AI应用向更广泛的硬件环境普及。

长十乙首飞回收成功：中国航天迈入复用时代，机遇挑战并存待突破

但接下来一个消息，对商业航天市场的影响就比较复杂了，我们不难估计，以长征十号乙火箭为代表的这一批航天科技集团搞的商业火箭，在实现快速复用上的速度，可能比想象之中快不少。这是一个很有挑战的事情，毕竟当下国内…

2026-07-18

商汤科技携手国星宇航 2026首发“商汤号” 2030构建千星万P太空算力星座

7月18日，在WAIC 2026商汤科技“基座大模型架构创新与生态合作论坛”上，商汤大装置与成都国星宇航科技股份有限公司签署战略合作协议。双方宣布共建商汤算力星座，星座规模预计将达到千星万P，共同推动AI基…

2026-07-18

首位香港宇航员黎家盈：空间站“活跃使者”凝聚两岸三地家国情

7月17号，正在天空执行任务的中国宇航员、载荷专家黎家盈专门发来视频，向世界人工智能大会AI女性论坛表达祝贺。这是这位宇航员进入空间站之后，第三次通过视频镜头参与活动和表达祝贺了。不过由于这是来自香港的首位…

2026-07-18

专访星环科技孙元浩：AI时代，GPU原生数据库如何开启“火星移民”新征程

这也是星环科技在 WAIC 2026 期间发布 GPU 原生认知数据库预览版背后的核心判断：当数据基础设施开始直接面向 AIAgent，数据库需要从计算架构到能力体系重新设计。AI Agent 的大脑在 …

2026-07-18

印度民营航天新突破！“维克拉姆-1”火箭成功发射送多载荷入轨

快科技7月18日消息，据媒体报道，印度民营航天企业SkyrootAerospace今日成功发射自主研发的轨道运载火箭“维克拉姆-1”（Vikram-1），顺利将多枚载荷送入近地轨道。此次发射完成后，印度…

2026-07-18

台积电A14制程进展迅猛，手机AI客户积极设计，性能能效双提升可期

2026-07-18

东方算芯DF1000亮相世界人工智能大会：全国产供应链突破算力瓶颈获大奖

2026-07-18

清华团队打造拓元系统：国产芯片异构调度，日产千亿Token释放算力价值

2026-07-18

WAIC首日干货满满！图灵奖得主、院士等齐聚，共探AI新趋势与新边界

2026-07-18

华为MateBook Pro斩获L3级人工智能认证引领PC智能化新体验

2026-07-18