华为开发者大会2025(HDC 2025)盛大开幕,华为云计算领域迎来了重大突破。会上,华为常务董事兼华为云计算CEO张平安隆重推出了盘古大模型5.5版本,该版本在自然语言处理(NLP)、计算机视觉(CV)、多模态、预测以及科学计算五大核心领域实现了全面革新,为各行各业带来了前所未有的价值。
张平安在会上详细介绍了盘古大模型5.5的各项升级。在自然语言处理方面,全新的718B深度思考模型采用了256个专家组成的MoE架构,显著增强了知识推理、工具调用及数学处理能力,达到了业界领先水平。这一模型的成功,标志着昇腾架构在打造世界级大模型方面的强大实力。
盘古大模型5.5还针对用户体验进行了多项优化。例如,通过引入自适应快慢思考合一技术,模型能够根据不同问题的难易程度灵活切换思考模式,实现了简单问题的快速响应和复杂问题的深度解析,整体推理效率提升了8倍。盘古深度研究DeepDiver技术的应用,让模型在网页搜索、常识性问答等场景中展现出极高的执行效率,能够在极短时间内完成复杂问答和专业报告的生成。
在预测领域,盘古大模型5.5采用了业界首创的triplettransformer统一预训练架构,成功将不同行业的数据进行统一编码和高效处理,极大地提升了预测精度和跨行业、跨场景的泛化能力。这一创新不仅为工业界带来了更为精准的预测工具,也为科学研究提供了强有力的支持。
在科学计算领域,华为云不断拓展盘古大模型的应用边界,与多个科学应用领域实现了深度融合。深圳气象局基于盘古大模型升级的“智霁”大模型,首次实现了AI集合预报,为天气预报提供了更为直观和准确的预测结果。重庆市气象局则针对成渝地区的降水特点,打造了“天资·12h”气象大模型,显著提升了灾害天气的日内预报预警能力。深圳能源也采用盘古大模型进行中短期风光水发电量预测,有效减少了发电侧的弃电现象,提升了能源开发效率。
在计算机视觉方面,华为云发布了全新MoE架构的300亿参数视觉大模型,成为业界最大的视觉模型。该模型支持图像、红外、激光点云、光谱、雷达等多维度、泛视觉的感知、分析与决策,为工业场景的智能化提供了有力保障。同时,盘古CV大模型还通过跨维度生成模型构建了稀缺的泛视觉故障样本库,极大提升了业务场景的可识别种类与精度。
盘古多模态大模型也迎来了全新升级。基于盘古多模态大模型的世界模型,可以为智能驾驶、具身智能机器人的训练构建所需的数字物理空间,实现持续优化迭代。在智能驾驶领域,通过输入行车场景、控制信息和路网数据,盘古世界模型即可生成每路摄像头的行车视频和激光雷达的点云,为智能驾驶提供了大量的训练数据,降低了路采成本。
在过去的一年里,盘古大模型已在30多个行业、500多个场景中得到了广泛应用,并在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥了巨大作用。盘古大模型的持续深耕和创新,正不断重塑各行各业,引领着行业AI的先锋潮流。