ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

36天再推新!小米MiMo-V2.5系列大模型亮相,AI赛道加速狂飙

时间:2026-04-23 20:52:08来源:互联网编辑:快讯

小米再次在大模型领域掀起波澜。继上月发布三款自研大模型后,这家科技巨头于近日深夜正式推出新一代MiMo-V2.5系列,包含四款不同定位的模型:旗舰版MiMo-V2.5-Pro、通用版MiMo-V2.5,以及专注语音合成的V2.5-TTS Series和语音识别的V2.5-ASR。其中前两款模型将于近期面向全球开发者开源,后两者则进入最终测试阶段。

新系列被定义为"智能体时代全栈解决方案",构建了覆盖推理、多模态交互与语音处理的完整技术矩阵。旗舰型号MiMo-V2.5-Pro专为复杂智能体任务设计,在内部测试中展现出惊人能力:配合特定运行框架可稳定处理近千轮工具调用的超长任务,在保持逻辑连贯性的同时精准捕捉上下文隐含要求。该模型在AI编程智能体基准测试SWE-Bench Pro中取得57.2分,与行业顶尖模型Claude Opus 4.6仅相差0.1分;在小米自研的MiMo Coding Bench评测中,其得分从上一代的71.5分提升至73.7分,逐步缩小与头部模型的差距。

技术团队披露的实战案例更具说服力。在实现完整SysY编译器的挑战中,V2.5-Pro仅用4.3小时完成672次工具调用,在隐藏测试集取得满分成绩,而人类开发者通常需要数周时间。另一个独立开发Web视频编辑器的任务中,该模型通过1868次工具调用构建出包含多轨道时间线、片段裁剪等功能的完整应用,最终生成8192行代码。这些突破标志着长程任务处理能力发生质变,为智能体落地复杂应用场景奠定基础。

通用型号MiMo-V2.5则聚焦多模态交互场景,支持视觉、听觉与文本信息的一体化处理,上下文窗口扩展至100万Token。相较于Pro版本,其平均推理速度提升30%,更适合对响应延迟敏感的实时交互场景。在评估智能体解决现实问题能力的Claw-eval多模态评测中,该模型取得23.8分,较前代提升50%。

成本优化成为新系列另一大亮点。通过深度优化Token利用率,V2.5-Pro在相同评测分数下较Kimi K2.6节省42%计算资源,V2.5较Muse Spark节省50%。配套的定价体系同步调整:取消复杂计费模式,推出"连续包月/包年"订阅方案,并在每日零点至八点提供八折优惠。不同版本采用差异化消耗倍率,通用版保持1倍基准,旗舰版设定为2倍,整体使用成本显著下降。

这种快速迭代能力源于小米对AI的战略级投入。公司创始人雷军今年3月宣布,未来三年将投入超600亿元用于AI技术研发,为模型训练提供充足算力支持。大模型团队负责人罗福莉指出,行业正经历从"对话交互"到"智能体范式"的剧烈转变,小米需要抓住移动端智能体赛道的关键窗口期。

终端生态的协同效应开始显现。小米澎湃OS 3 Beta版已向部分机型推送"龙虾"智能体Xiaomi miclaw,新增人格体系、技能体系与跨设备同步功能,支持80余项系统工具调用。这种模型能力与终端体验的双向促进,正在形成独特的竞争优势——更强大的模型支撑更智能的终端服务,海量终端数据反哺模型持续优化。随着600亿投入逐步落地,小米的"月更模式"或许将重塑行业技术迭代节奏。

更多热门内容
谷歌推出26B规模DiffusionGemma模型:文本生成速度飙升 本地推理新利器
Gemmna 家族有了新成员 ——DiffusionGemma,一个探索文本扩散的实验性开源模型,在文本生成任务上速度极快。 谷歌 CEO皮查伊表示,「DiffusionGemma 是一款开放的实验性模型…

2026-06-12

钉钉换帅陈宇森接棒:阿里以AI Native为笔,续写“以人为本”新篇章
而在“变与不变”的辩证中,贴文写明“阿里的未来在于创新”,但也指出“创新依靠的从来不是高压和机械执行,AI时代更是如此”,更加强调,无论时代如何改变,技术如何发展,阿里“相互尊重、视人为人、有情有义”的文化…

2026-06-12

二十年匠心筑梦电梯智能化:上海鑫菱以创新产品守护智慧安全乘梯路
成立于 2006 年的上海鑫菱机电设备有限公司,深耕电梯智能化领域二十年,是专注电梯紧急呼救、全场景梯控设备的高新技术企业。 上海鑫菱打造对讲系统、梯控系统、电源系统、定制化软硬件、电梯综合配件五大产品体系,…

2026-06-12