ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

浪潮YuanLab.ai开源40B参数源Yuan 3.0 Flash大模型,多任务表现优成本低

时间:2025-12-31 19:08:30来源:快讯编辑:快讯

浪潮旗下YuanLab.ai团队近日宣布开源发布多模态基础大模型Yuan 3.0 Flash,该模型凭借400亿参数规模与创新的稀疏混合专家(MoE)架构,在推理效率与成本控制方面实现突破性进展。单次推理仅需激活约37亿参数,显著降低了算力需求,为企业级应用提供了更经济的解决方案。

模型核心创新在于引入强化学习训练方法RAPO,通过反思抑制奖励机制(RIRM)优化训练流程。这一设计有效减少了无效反思行为,在提升推理准确性的同时,将token消耗压缩至行业领先水平的1/4至1/2。语言主干网络采用局部过滤增强注意力结构(LFA)与MoE架构的双重优化,既保证了注意力精度,又进一步降低了训练与推理的算力开销。

多模态处理能力方面,Yuan 3.0 Flash构建了视觉编码器、语言主干网络与多模态对齐模块的协同体系。视觉信号经编码器转化为token后,与语言token共同输入主干网络,通过跨模态对齐模块实现特征高效融合。特别设计的自适应图像分割机制,在支持高分辨率图像理解的同时,将显存需求降低30%以上,为复杂场景应用扫清硬件障碍。

实测数据显示,在企业场景的RAG(ChatRAG)、多模态检索(Docmatix)、表格理解(MMTab)及摘要生成(Summeval)等任务中,Yuan 3.0 Flash的表现已超越GPT-5.1。在多模态推理与语言推理评测中,其400亿参数版本精度接近2350亿参数的Qwen3-VL235B-A22B与6710亿参数的DeepSeek-R1-0528,但token消耗仅为后两者的1/4至1/2,展现出极高的性价比优势。

目前,Yuan 3.0 Flash已全面开源,全系列模型参数与训练代码均开放免费下载。开发团队表示,此举旨在推动多模态大模型在工业界的普及应用,通过降低技术门槛与使用成本,加速AI技术向实体经济渗透。开源地址已同步公布,供全球开发者与研究机构自由使用。

更多热门内容
2025砥砺奋进绘就华章,2026勇毅前行再启新程——共赴智能化新征程
在生态伙伴的支持下,鸿蒙生态体验加速从“可用”到“好用”,鸿蒙5.0以上终端设备超过3600万; …… 这就是我们在2025年的点滴片段,在世界的每个角落,我们用坚韧克服困难,用专业创造价值,用热爱激励彼此…

2025-12-31

孟晚舟2026新年致辞:华为以数智深耕,迎智能化浪潮创价值新篇
致辞中,孟晚舟既回望了2025年全体华为人攻坚克难的奋斗历程,也明确了新一年“战略聚焦,决胜价值战场,以质取胜,做强组织能力”的核心方向,“人工智能技术与行业知识融合重构核心业务价值”的战略判断,为华为在智能…

2025-12-31