ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

二手硬件显神威:6根傲腾内存助力单GPU工作站运行万亿参数大模型

时间:2026-05-25 03:39:51来源:互联网编辑:快讯

近日,科技领域传来一则引人注目的消息:一名Reddit用户APFrisco凭借独特的硬件组合与软件优化方案,在单GPU工作站上成功运行了参数规模达1万亿的Kimi K2.5大模型,推理速度稳定在每秒4个Token。这一成果为高参数模型在有限硬件环境下的部署提供了新思路。

该系统的核心硬件配置颇具特色。处理器采用英特尔至强金牌6246,搭配泰安S5630GMRE-CGN主板构建计算平台。内存系统由两部分组成:6根32GB三星DDR4-2666 ECC内存条提供基础内存容量,6根128GB英特尔傲腾DCPMM持久内存模块则作为扩展存储,两者协同工作使总内存容量达到768GB。图形处理任务由两张华硕GeForce RTX 3060 OC 12GB显卡共同承担,存储设备选用西部数据WD SN850X 2TB固态硬盘,电源系统采用华擎Steel Legend SL-850G 850W全模组电源确保稳定供电。

软件层面的优化是该方案的关键突破。研发团队基于llama.cpp框架开发了GPU与CPU混合推理方法,通过设置override-tensor标志,将模型路由组件强制分配至GPU显存处理。由于两张显卡共提供24GB显存,系统巧妙地将核心计算任务集中于此,而将剩余参数存储于傲腾内存模块中。这种设计有效解决了单卡显存容量不足的瓶颈问题,使大规模模型能够在消费级硬件上运行。

英特尔傲腾系列产品的技术特性在此方案中发挥重要作用。尽管该产品线已停止生产,但其独特的持久化内存特性——读写速度介于传统DRAM与固态硬盘之间——使其成为替代高成本内存方案的理想选择。傲腾模块不仅能够提供大容量存储空间,还能保持相对较高的数据访问速度,这种中间层特性恰好满足了大模型推理过程中对内存容量与速度的双重需求。

行业观察人士指出,随着CXL计算快速连接标准的逐步成熟,内存架构将迎来新的发展机遇。这项标准通过统一内存访问接口,能够实现CPU、GPU与加速卡之间的内存池化共享,为构建高性价比的大容量内存解决方案提供技术基础。未来,这类技术有望缓解大型语言模型训练与推理过程中对内存容量的迫切需求,推动AI应用向更广泛的硬件环境普及。

更多热门内容
创立五年即成AI新贵,Anthropic估值或超9000亿美元,领跑全球AI赛道
Anthropic本轮融资规模超过300亿美元,红杉资本、Dragoneer Investment Group、AltimeterCapital和Greenoaks Capital Partners预计将…

2026-05-25

2026年换机潮来袭?五大理由告诉你为何现在换新机更明智
但2026年的手机市场真的不一样,迪子真的要劝大家提前进行新机的选择了,原因则是给大家分为了五点。如果安卓市场真的和iPhone一样,那么今年下半年大概率只会看到Pro系列机型,标准版机型只能明年见。 不…

2026-05-25

山东日照佳安智能:工程师调试复合机器人 工业具身领域布局成熟
5月24日,在山东日照南科佳安机器人科技有限公司测试车间,工程师调试自主研发的复合机器人。佳安智能是一家致力于工业具身智能机器人及核心部件研发、生产与销售的高新技术企业,目前已在工业具身垂直领域形成成熟布局…

2026-05-24

创立五年即冲刺9000亿美元估值,Anthropic或超OpenAI成AI界新领航者
Anthropic本轮融资规模超过300亿美元,红杉资本、Dragoneer Investment Group、AltimeterCapital和Greenoaks Capital Partners预计将…

2026-05-24