ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

华为盘古718B模型脱颖而出:数据质量与技术创新双轮驱动

时间:2025-09-29 15:24:42来源:互联网编辑:快讯

在竞争激烈的大模型领域,华为凭借其7180亿参数的MoE架构模型openPangu-Ultra-MoE-718B,于最新一期SuperCLUE中文大模型通用基准测评中跻身前三,引发行业广泛关注。该测评通过数学推理、科学推理、代码生成等六大核心维度,综合评估1260道题目,华为模型在开源与国产模型赛道中展现出强劲实力。

与传统依赖海量数据堆砌的路径不同,openPangu团队提出“以思考替代堆砌”的训练哲学,构建了覆盖数据生成、筛选、增强的全流程质量控制体系。团队建立三级审核机制,结合规则模型与人工评估,严格过滤低质量样本;同时通过去重算法与压缩选样技术,在保证领域覆盖广度的前提下避免数据冗余。针对模型复杂场景推理能力不足的痛点,团队引入自迭代拒绝采样策略,重点强化中高难度任务训练,确保模型适应真实世界的复杂需求。

在预训练阶段,团队创新设计三阶段递进策略:通用阶段通过大规模文本与代码学习构建世界知识基础;推理阶段大幅提升数学、STEM及代码数据比重,并引入详细思维链(CoT)引导模型学习逻辑路径;退火阶段则通过阶梯式扩展上下文长度至128K,同步增加指令类数据与Agent交互数据,为模型使用外部工具奠定基础。这种分阶段强化核心能力的训练方式,有效平衡了模型的知识广度与推理深度。

针对大型语言模型普遍存在的幻觉问题,研究团队开发出“批判内化”机制。该机制突破传统批判微调依赖固定人类反馈的局限,在模型训练后期引入自我批判信号,使其能够根据任务准则主动审视推理过程。实验数据显示,这一创新使模型在逻辑链条完整性、指令遵从性及价值观对齐方面显著提升,输出结果更加精炼可靠。

在工具使用能力提升方面,团队推出ToolACE合成框架,通过领域工具组合、交互式轨迹生成等技术,生成高复杂度多轮工具调用数据。例如将日历查询与航班预订工具关联,提供依赖关系图谱;采用“计划-执行”分离策略模拟真实交互场景;引入多智能体对话生成复杂交互数据。多维校验机制则对生成数据进行内容满足度、状态变化正确性等维度评估,形成数据迭代优化的闭环。

后训练阶段,团队实施三步优化方案:渐进动态微调通过平滑过渡常规SFT与动态微调模式,避免过拟合风险;强化学习阶段采用GSPO算法提升大型MoE模型训练稳定性;模型融合环节运用黑盒优化技术,自动搜索不同版本模型的最佳组合权重。这种系统性优化策略,使最终模型在综合性能上实现质的飞跃。

openPangu-718B的成功实践表明,大模型竞争的核心已从数据规模转向技术深度。通过构建质量优先的数据体系、设计分阶段能力强化路径、创新幻觉控制机制、开发高仿真工具学习框架,华为为行业提供了技术突破的新范式。这种对技术细节的极致打磨,正重新定义大模型时代的核心竞争力标准。

更多热门内容
象屿集团携手钉钉,借AI之力开启数智化新篇,3万员工共赴转型新程
象屿集团此次与钉钉合作,不仅是AI技术平台的引入,更是双方对未来发展方向的高度共识。 值得一提的是,象屿集团此次全面引入钉钉One、DingTalkA1、AI听记、AI搜问、AI表格等钉钉AI新品,聚焦用…

2025-09-29

云天励飞加入OISA生态,以“算力积木”助力国产AI算力突破MoE大模型瓶颈
凭借在 AI 推理芯片与算力架构的长期积累,云天励飞成为 OISA 生态的重要一员。 未来,云天励飞将继续秉持“AI时代的加速器”愿景,持续迭代芯片技术与架构创新,携手 OISA 生态伙伴,共同推动智能算…

2025-09-29

四川资源集团携手华为 共绘智慧矿山蓝图 探索数智化赋能新路径
封面新闻记者 付文超9月29日,记者获悉,四川省自然资源投资集团有限责任公司(以下简称“四川资源集团”)与华为技术有限公司(以下简称“华为”)签署框架合作协议。 根据协议,双方将在智慧矿山规划和建设、人工智…

2025-09-29

Flash Attention作者Tri Dao:英伟达GPU主导地位或三年内瓦解,AI硬件将迎多元生态
他们设计了非常好的芯片,也有非常好的软件支持,这让我能够做很多有意思的事情,而这正是我追求的:能不能做出有意思的东西。举例我做的Mamba,思路是让模型把历史压缩成更小的状态向量,而不是保存完整的KV c…

2025-09-29