ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

深圳深智城集团助力国产算力新飞跃:万亿级AI大模型训练获突破性进展

时间:2026-06-13 18:49:28来源:快讯编辑:快讯

近日,深圳市智城算网科技有限公司(隶属深智城集团)携手多家高校及科研机构,成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。这一突破标志着国产AI算力从模型推理部署迈向全参数深度训练的新阶段,为国内人工智能产业链自主化发展注入强劲动力。

万亿级参数大模型作为人工智能领域的前沿技术,在逻辑推理、数理计算、代码生成等复杂任务中表现卓越。然而,其全参数训练对硬件算力、集群稳定性及算法优化提出极高要求。长期以来,全球范围内此类训练主要依赖海外高端算力设备,国产算力因技术瓶颈多用于模型推理或小幅微调,全参数深度训练能力成为制约行业发展的关键难题。

DeepSeek-V4-Pro采用混合专家模型(MoE)架构,其训练过程犹如指挥一支由数千名“专家”组成的庞大团队。日常任务中仅需激活少数专家,但后训练阶段需协调全部专家协同工作,沟通量激增数十倍。动态注意力机制的引入更对芯片算力调度和显存管理提出严苛挑战,相当于在单行道基础上构建复杂立交桥,计算与通信需求呈指数级增长。

面对技术极限,深智城算力平台通过系统性创新实现突破:构建前置预警与精细化运维体系,确保1500余步训练零中断;优化网络架构与通信协议,使算力利用率(MFU)提升超30%;开发验证超100个基础算子,充分释放国产芯片硬件加速潜能。同时,创新供电架构与能效管理方案,在保障高算效的同时降低能耗,并建立覆盖全流程的问题定位机制,为训练稳定性提供多重保障。

此次突破不仅验证了国产算力集群承载超大参数模型训练的技术可行性,更为行业带来显著效益:通过降低对海外算力依赖,可有效控制AI应用成本;自主化技术路径有助于提升产业链安全水平;优化后的训练框架为后续研发提供可复制经验,加速人工智能技术在智慧城市、工业制造等领域的落地应用。

深智城集团表示,将持续深化国产算力集群研发运营能力,通过构建更高效的算力基础设施底座,为深圳打造人工智能先锋城市提供核心支撑。此次实践表明,国产算力已具备突破关键技术封锁、服务国家战略需求的硬实力,为全球AI技术发展贡献中国方案。

更多热门内容
AI赋能科研新突破:火箭研发提速,科学探索开启智能新篇章
在北京科学智能研究院,随着AI被引入,计算效率跃升约千倍,火箭发动机从构想到实物验证的周期压缩至2周。 北京科学智能研究院院长李鑫宇说,研究院专注于AI赋能科学研究相关技术突破,研究院推出的AI技术正在改变…

2026-06-13

武汉工商学院开放日:机器人“大显身手” 答疑互动萌态十足引赞叹
极目新闻通讯员 李洋洋6月12日上午,在武汉工商学院举行的校园开放日上,来自汉口的考生小陈对着手机镜头记录下这段体验。 当天,学校在传统的展位咨询与宣传资料发放之外,专门安排了一组智能设备与考生和家长互动,…

2026-06-13

“天工”多款机器人备战人形机器人运动会,未来或实现机器人造机器人
记者看到,每一台机器人旁边都有一名数据采集人员负责操控设备,完成全套动作,搭载的采集系统同步记录机器人关节运动角度、运行力矩等信息,每一组动作轨迹、每一次力度变化都被完整留存。 北京人形机器人创新中心中试验…

2026-06-13

AI赋能科研新突破:火箭发动机研发提速,科学仪器开启“智能”新篇
在北京科学智能研究院,随着AI被引入,计算效率跃升约千倍,火箭发动机从构想到实物验证的周期压缩至2周。 北京科学智能研究院院长李鑫宇说,研究院专注于AI赋能科学研究相关技术突破,研究院推出的AI技术正在改变…

2026-06-13

河南移动举办医疗信息化交流会 四大创新中心助力智慧医疗升级
四大创新中心的落地,标志着河南移动医疗生态体系的全面升级,推动合作模式从单一项目向常态化、专业化、深层次战略协同跃升,精准聚焦医疗AI创新、智慧基建建设、医疗数据治理等关键领域,为全省智慧医疗的技术迭代、场…

2026-06-13