小米近日正式宣布开源其自研的Xiaomi MiMo-V2-Flash模型,这一消息在科技领域引发广泛关注。该模型是小米为追求极致推理效率而专门研发的混合专家(MoE)架构模型,总参数规模达309B,激活参数为15B。通过引入创新的Hybrid注意力架构以及多层MTP推理加速技术,该模型在多个智能体测评基准中表现优异,成功跻身全球开源模型前两名。
在性能对比方面,Xiaomi MiMo-V2-Flash展现出显著优势。其代码生成能力可与行业标杆闭源模型Claude 4.5 Sonnet相媲美,但推理成本仅为后者的2.5%,同时生成速度提升至两倍。这种高性价比的表现,使其在开源模型领域形成独特竞争力。据技术团队介绍,该模型在保持高性能的同时,通过架构优化实现了资源利用的最大化。
在2025小米“人车家全生态”合作伙伴大会上,Xiaomi MiMo大模型负责人罗福莉详细阐述了模型的技术突破。她指出,MiMo-V2-Flash在多数评测基准上已超越DeepSeek V3.2和K2-Thinking等知名模型,且参数量较这些模型减少二分之一至三分之二。在速度与成本的平衡方面,该模型在全球顶尖模型中处于领先位置,初步具备模拟现实世界的能力,为智能终端的应用拓展提供了新的可能性。
罗福莉进一步分享了对下一代智能体系统的展望。她认为,未来的智能体不应局限于语言模拟,而应成为真正理解人类世界并与之共存的存在。在执行能力上,智能体需要从单纯回答问题转向完成任务,具备记忆、推理、自主规划、决策和执行等综合能力。从感知层面看,统一多模态感知是关键,这能为理解物理世界奠定基础,使智能体更好地融入眼镜等可穿戴设备,推动人机交互方式的革新。