小米MiMo大模型三连更！神秘模型现真身，还能免费体验养虾新玩法-业界动态-ITBear科技资讯

小米公司今日宣布，其自主研发的MiMo大模型系列迎来重大更新，推出旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni以及语音合成大模型MiMo-V2-TTS。此次更新聚焦于提升智能体能力，旨在为用户提供更高效、更智能的交互体验。

MiMo-V2-Pro作为旗舰基座模型，总参数量超过1T，激活参数量达到42B，支持100万上下文长度。该模型在编程Agent、通用Agent和工具使用方面展现出强大能力，性能与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro等国际领先模型相近。在OpenClaw标准评测榜单PinchBench和Claw-eval上，MiMo-V2-Pro排名第三，仅次于Claude Sonnet 4.6和Claude Opus 4.6。MiMo-V2-Pro的API定价仅为Claude Opus 4.6的1/5，具有显著的价格优势。

全模态基座模型MiMo-V2-Omni则专注于多模态交互与执行场景，支持文本、视觉、语音全模态输入。该模型在音频理解、图像理解和视频理解方面均表现出色，能够跨模态理解复杂环境、自主制定并执行计划，并在遇到异常时实时修正策略。例如，MiMo-V2-Omni可以像人一样操控浏览器，根据用户指令在小红书查找信息、在京东比价下单，甚至与客服砍价。该模型还支持接入WPS Office，通过自然语言指令直接生成Word、Excel、PPT和PDF等文档。

语音合成大模型MiMo-V2-TTS则致力于让智能体拥有更自然、更富有情感的声音。该模型基于小米自研的Audio Tokenizer和多码本语音-文本联合建模架构，经过上亿小时语音数据的大规模预训练和多维度强化学习，实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS支持多方言、多角色、多语气生成，能够智能识别文本中的标点符号、语气词和强调标记，并将其转化为恰当的语音表达。该模型还支持高质量的歌声合成，让智能体既能说、能演，也能唱。

据悉，MiMo-V2-Pro和MiMo-V2-Omni的早期测试版曾以匿名模型Hunter Alpha和Healer Alpha的身份在全球最大API聚合平台OpenRouter上引发热议，其API调用量多天登顶日榜。目前，这两个匿名模型仍在OpenRouter向开发者免费开放。MiMo-V2-Pro和MiMo-V2-Omni还将联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等智能体开发框架团队，为全球开发者提供为期一周的限时免费接口支持。

苹果WWDC 2026概览：发布Siri AI、iOS 27、Apple Intelligence等

2026-06-10

有关第三代模型，苹果管理层回应一切

2026-06-10

OpenAI 为什么要冒死「脱离群众」？

2026-06-10

辛巴大徒弟赵梦澈宣布离开辛选，退出直播行业

2026-06-10

亚马逊深耕视觉搜索：AI 重塑网购导航与拼贴式购物体验

2026-06-10

别只看 2 亿红枫，麒麟 9010S 才是底牌！华为nova16 Ultra体验

2026-06-10