在全球工业革命的浪潮之下,传统制造业正加速向智能化、数字化转型,这一转变的核心在于如何高效地将复杂的专业数据与先进的机器学习技术相结合,打造用户导向的智能系统。在中国科学技术大学,宋骐教授团队携手鲲鹏昇腾科教创新卓越中心,依托昇腾平台的强大算力,成功开发出领域知识构建与增强推理框架,为这一转型提供了创新方案。
该团队的研究聚焦于三大领域,并取得了显著成果。在构建工业知识图谱方面,面对工业数据复杂多变、多模态异构的特性,团队创新性地融合了领域小模型与大语言模型,通过知识增强的命名实体识别框架,极大地提升了实体抽取的准确性和泛化能力。这一过程中,昇腾分布式训练加速库MindSpeed发挥了关键作用,其支持的多维并行策略和多种开源框架兼容性,使得团队能够灵活处理多模态数据的异构特征。通过“精准筛选-深度识别-知识引导”的三阶段流程,实现了知识抽取效率与质量的双重飞跃。
在工业设备智能运维系统的开发中,团队针对高昂的人工成本、数据分析不足及预测精度受限等问题,提出了基于多模态知识图谱的创新技术路径。系统采用ETL架构统一处理多模态数据,利用RDF语义网技术构建知识图谱,清晰展现设备、状态与故障间的关联。通过结合注意力机制的特征融合模型与图嵌入技术,将复杂知识转化为全面反映设备状态的综合特征。团队还研发了故障智能预测诊断模块,通过对比异常数据特征与知识图谱中的历史故障,准确推断故障类型、严重程度及维修建议,实现了智能运维的全链条覆盖。
针对领域知识与大规模预训练语言模型融合过程中的计算资源消耗、灵活性不足及噪声知识干扰等问题,团队依托昇腾平台的强大计算能力,创新性地提出了知识增强与过滤框架。在知识增强环节,利用PLM嵌入空间的冗余位降低计算负担;在噪声过滤环节,设计知识增强过滤器,结合掩码训练,有效排除了噪声知识的干扰。这一框架在实现计算成本大幅降低的同时,显著提高了知识增强的灵活性与效率。
宋骐教授团队的这一系列科研成果,不仅构建了一套基于昇腾平台的工业知识增强大模型技术体系,还显著提升了工业设备智能运维的水平与效率,实现了核心技术的自主创新与适配。这一技术体系为构建安全、高效、智慧的现代工业体系提供了关键支撑,展现了科技创新在推动实体经济高质量发展中的重要作用。
该团队的成功实践也为未来基于昇腾平台的持续探索与创新奠定了坚实基础。随着相关成果的进一步推广与应用,有望在更广泛的工业场景中发挥重要作用,推动科技创新与实体经济的深度融合,为制造业的智能化转型贡献更多智慧与力量。