36天再推新！小米MiMo-V2.5系列大模型亮相，AI赛道加速狂飙-业界动态-ITBear科技资讯

小米再次在大模型领域掀起波澜。继上月发布三款自研大模型后，这家科技巨头于近日深夜正式推出新一代MiMo-V2.5系列，包含四款不同定位的模型：旗舰版MiMo-V2.5-Pro、通用版MiMo-V2.5，以及专注语音合成的V2.5-TTS Series和语音识别的V2.5-ASR。其中前两款模型将于近期面向全球开发者开源，后两者则进入最终测试阶段。

新系列被定义为"智能体时代全栈解决方案"，构建了覆盖推理、多模态交互与语音处理的完整技术矩阵。旗舰型号MiMo-V2.5-Pro专为复杂智能体任务设计，在内部测试中展现出惊人能力：配合特定运行框架可稳定处理近千轮工具调用的超长任务，在保持逻辑连贯性的同时精准捕捉上下文隐含要求。该模型在AI编程智能体基准测试SWE-Bench Pro中取得57.2分，与行业顶尖模型Claude Opus 4.6仅相差0.1分；在小米自研的MiMo Coding Bench评测中，其得分从上一代的71.5分提升至73.7分，逐步缩小与头部模型的差距。

技术团队披露的实战案例更具说服力。在实现完整SysY编译器的挑战中，V2.5-Pro仅用4.3小时完成672次工具调用，在隐藏测试集取得满分成绩，而人类开发者通常需要数周时间。另一个独立开发Web视频编辑器的任务中，该模型通过1868次工具调用构建出包含多轨道时间线、片段裁剪等功能的完整应用，最终生成8192行代码。这些突破标志着长程任务处理能力发生质变，为智能体落地复杂应用场景奠定基础。

通用型号MiMo-V2.5则聚焦多模态交互场景，支持视觉、听觉与文本信息的一体化处理，上下文窗口扩展至100万Token。相较于Pro版本，其平均推理速度提升30%，更适合对响应延迟敏感的实时交互场景。在评估智能体解决现实问题能力的Claw-eval多模态评测中，该模型取得23.8分，较前代提升50%。

成本优化成为新系列另一大亮点。通过深度优化Token利用率，V2.5-Pro在相同评测分数下较Kimi K2.6节省42%计算资源，V2.5较Muse Spark节省50%。配套的定价体系同步调整：取消复杂计费模式，推出"连续包月/包年"订阅方案，并在每日零点至八点提供八折优惠。不同版本采用差异化消耗倍率，通用版保持1倍基准，旗舰版设定为2倍，整体使用成本显著下降。

这种快速迭代能力源于小米对AI的战略级投入。公司创始人雷军今年3月宣布，未来三年将投入超600亿元用于AI技术研发，为模型训练提供充足算力支持。大模型团队负责人罗福莉指出，行业正经历从"对话交互"到"智能体范式"的剧烈转变，小米需要抓住移动端智能体赛道的关键窗口期。

终端生态的协同效应开始显现。小米澎湃OS 3 Beta版已向部分机型推送"龙虾"智能体Xiaomi miclaw，新增人格体系、技能体系与跨设备同步功能，支持80余项系统工具调用。这种模型能力与终端体验的双向促进，正在形成独特的竞争优势——更强大的模型支撑更智能的终端服务，海量终端数据反哺模型持续优化。随着600亿投入逐步落地，小米的"月更模式"或许将重塑行业技术迭代节奏。