ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

摩尔线程新动向!"夸娥智算集群1.2版"有何惊喜?

时间:2024-08-19 21:28:13来源:ITBEAR编辑:快讯

【ITBEAR】8月19日消息,摩尔线程“夸娥智算集群 KUAE”1.2 版本正式发布,此次更新在软硬件层面进行了全面优化,并增加了对多种大模型的支持。新版本在多个方面都带来了显著的提升和新增功能。

具体来说,新版本在使用千卡集群训练千亿模型时,MFU 提升了 10%,而在稠密模型集群训练中,MFU 最高可达 55%。此外,通过集成最新的 MUSA SDK 平台与优化后的 Flash Attention2 技术,结合新版 Torch MUSA 和算子融合,新版本在提升大模型训练效率与资源利用率的同时,也缩短了训练周期并降低了整体成本。

据ITBEAR了解,新版本还增强了对长文本大模型训练的支持,优化了处理长文本理解和生成任务的能力,能够更好地应对文档摘要、文章写作等复杂语言处理任务。同时,MCCL 通信库完成了 All2All 优化,并针对 muDNN 算子在不同形状下的矩阵运算进行了优化,以更好地支持 MoE(Mixture of Experts)大模型的训练。

在训练效率方面,新版本进一步提升了大模型训练的 Checkpoint 读写性能,写入时间小于 2 秒。同时,实现了基于摩尔线程 GPU 集群的 DeepSpeed 与 Ulysses 的适配和性能优化,强化了长文本训练支持,并适配了国内外多款大模型,支持在 Hugging Face 上训练和微调主要开源大模型。

在稳定性方面,千卡集群软硬件进一步成熟,实现了连续无故障训练 15 天。新版本还引入了 KUAE Aegis 可靠性功能,加强对 GPU、显存、集合通信等方面的监控、自动诊断与故障恢复能力。同时,引入了 PerfSight 性能监控系统,可实时显示模型训练过程中的资源消耗与性能分析数据。

此外,KUAE 内置模型库 Model Zoo 也新增了 LLaMA2 全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型,为用户提供更丰富的选择。此前,摩尔线程 AI 旗舰产品夸娥(KUAE)智算集群解决方案已从当前的千卡级别扩展至万卡规模,具备万 P 级浮点运算能力。摩尔线程计划开展三个万卡集群项目,分别为青海零碳产业园万卡集群项目、青海高原夸娥万卡集群项目、广西东盟万卡集群项目。

更多热门内容
从“绝不上市”到2.1万亿美元市值,SpaceX如何以创新突破改写商业航天与AI未来?
2026年6月12日,商业航天、通信与AI巨头SpaceX(美国太空探索技术公司)成功上市,这是人类商业史上最大的IPO,截至发稿时,总市值达到2.1万亿美元(约合人民币14万亿元),跃居成为美国第六大市值公…

2026-06-14

市值1.77万亿背后:SpaceX逐利与中国航天为民,两条赛道各绽光芒
或许在大众认知里,SpaceX的成功,靠的是先进的火箭技术。我们的航天发展,从来不是为了低价发射卫星,而是要用太空技术,赋能民生、重塑社会运行模式。SpaceX书写的是美国商业资本的成功学,而中国航天,走的…

2026-06-14

京东A2P2协议登场:为智能体支付筑牢安全信任基石,开启便捷新篇
该协议重点聚焦中间的L3和L4两个等级:L3指智能体在单一任务内可以自主发起支付请求,系统在用户设定的边界内裁决是否放行;L4则给予智能体更多授权,只要支付金额、场景、用户等要素在预设范围内,智能体即可自主完…

2026-06-14

雷军直播小米YU7测试,回应“私家车装600斤车厘子”争议:封闭场地合规搬运
PChome 6月13日消息,小米创办人,董事长兼CEO雷军在中汽盐城测试场做YU7测试直播,直播中雷军回应了“用私家车装600斤车厘子被指违规”,他表示“我们1000斤的车厘子是卡车送到实验场,是在一个封闭…

2026-06-14

2026年十款高性价比手机深度测评,性能影像续航全解析,帮你精准选机不踩坑
荣耀 Power2 主打超长续航与稳定综合体验,最大的亮点就是搭载 10080mAh 青海湖电池,超大容量电池支持 6年长效健康使用,长期使用续航能力也不会大幅衰减。 REDMI Turbo 5 Max …

2026-06-14