ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

小米MiMo大模型三连更!神秘模型现真身,还能免费体验养虾新玩法

时间:2026-03-20 00:18:51来源:快讯编辑:快讯

小米公司今日宣布,其自主研发的MiMo大模型系列迎来重大更新,推出旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni以及语音合成大模型MiMo-V2-TTS。此次更新聚焦于提升智能体能力,旨在为用户提供更高效、更智能的交互体验。

MiMo-V2-Pro作为旗舰基座模型,总参数量超过1T,激活参数量达到42B,支持100万上下文长度。该模型在编程Agent、通用Agent和工具使用方面展现出强大能力,性能与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro等国际领先模型相近。在OpenClaw标准评测榜单PinchBench和Claw-eval上,MiMo-V2-Pro排名第三,仅次于Claude Sonnet 4.6和Claude Opus 4.6。MiMo-V2-Pro的API定价仅为Claude Opus 4.6的1/5,具有显著的价格优势。

全模态基座模型MiMo-V2-Omni则专注于多模态交互与执行场景,支持文本、视觉、语音全模态输入。该模型在音频理解、图像理解和视频理解方面均表现出色,能够跨模态理解复杂环境、自主制定并执行计划,并在遇到异常时实时修正策略。例如,MiMo-V2-Omni可以像人一样操控浏览器,根据用户指令在小红书查找信息、在京东比价下单,甚至与客服砍价。该模型还支持接入WPS Office,通过自然语言指令直接生成Word、Excel、PPT和PDF等文档。

语音合成大模型MiMo-V2-TTS则致力于让智能体拥有更自然、更富有情感的声音。该模型基于小米自研的Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练和多维度强化学习,实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS支持多方言、多角色、多语气生成,能够智能识别文本中的标点符号、语气词和强调标记,并将其转化为恰当的语音表达。该模型还支持高质量的歌声合成,让智能体既能说、能演,也能唱。

据悉,MiMo-V2-Pro和MiMo-V2-Omni的早期测试版曾以匿名模型Hunter Alpha和Healer Alpha的身份在全球最大API聚合平台OpenRouter上引发热议,其API调用量多天登顶日榜。目前,这两个匿名模型仍在OpenRouter向开发者免费开放。MiMo-V2-Pro和MiMo-V2-Omni还将联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等智能体开发框架团队,为全球开发者提供为期一周的限时免费接口支持。

更多热门内容
马斯克详解AI数据中心卫星规划,SpaceX欲建百万颗卫星太空算力网
在SpaceX正在进行史上最大规模IPO之际,首席执行官埃隆·马斯克详细展示了该公司计划建造的人工智能(AI)数据中心卫星的初始版本。 马斯克在社交媒体平台X上分享的一段30分钟视频中谈及SpaceX的未来规…

2026-06-10

Prada跨界航天:从时尚殿堂到月球征途,探索高端消费新边疆
Serdari认为,推动Prada对航天业产生兴趣的有两个核心因素:一是接触了那些正在考虑太空旅行的富裕消费者,二是其需要让品牌与前沿思维保持一致。 正如汽车工业塑造了20世纪的奢侈品文化,太空经济或许正在成…

2026-06-10

长征十二号首飞:国产火箭开启商业航天新篇,太空市场迎来中国力量
太空发射的门槛,从来不是技术,而是成本,这台火箭的竞争力,藏在三个实打实的硬指标里:通过可回收复用技术,发射单价从传统火箭的每公斤6-8万元,压缩至1-2万元,降幅超70%,彻底打破了海外企业长期以来的垄断…

2026-06-10