ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

罗福莉加入小米后首秀 解释MiMo-V2-Flash模型如何做到推理速度飞快

时间:2025-12-17 18:40:51来源:IT之家编辑:快讯

12 月 17 日消息,2025 小米人车家全生态合作伙伴大会于今日举行,Xiaomi MiMo 大模型负责人罗福莉迎来入职后首秀。

小米昨日晚间惊喜发布了 Xiaomi MiMo-V2-Flash 开源 MoE 模型,总参数量 309B,活跃参数量 15B,专为智能体 AI 设计,专注于快。不少小伙伴体验后发现,该模型推理速度非常快。

罗福莉解释称,MiMo-V2-Flash 围绕极致推理效率设计了模型结构,通过 3 层 MTP 推理加速并行 Token 验证,实现了 2.0~2.6 倍的推理速度提升。

MiMo-V2-Flash 凭借总参数 309B(激活 15B),实现了代码和 Agent 评测基准上全球开源模型 Top2,且初步具备模拟世界的能力,可通过 HTML 写操作系统、模拟太阳系、画一棵圣诞树等。

罗福莉还谈到了下一代智能体系统,认为下一代智能体系统不是一个“语言模拟器”,而是一个真正能够理解世界、并与之共存的“智能体”。

更多热门内容
DeepSeek融资后发力工程优化:DSpark框架让大模型推理提速最高达85%
除整体提升外,论文实验数据还揭示了显著的领域差异效应::结构化任务(如数学推理、代码生成)的可接受长度天然更高(例如Qwen3-4B在数学任务上平均为5.57,代码任务为5.12),而开放式对话场景则明显偏…

2026-06-29

B站17周年陈睿演讲:优质内容成增长引擎,UP主充电收入大涨71.1%
新榜讯 6月27日讯,哔哩哔哩(下称“B站”)今日迎来成立17周年。在周年庆现场,B站董事长兼CEO陈睿发表了题为“让好内容发生”的演讲。陈睿指出,尽管当下内容供给已呈过剩态势,但用户对优质内容的渴望依旧强烈…

2026-06-29