ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

小米MiMo降价99%背后:罗福莉用六项工程细节,拆解AI降本真实逻辑

时间:2026-05-31 22:20:53来源:快讯编辑:快讯

近日,小米旗下大模型MiMo-V2.5系列API宣布永久降价,最高降幅达99%,同时将所有context长度统一定价,Token套餐容量提升5至8倍。这一消息在AI行业引发广泛讨论,部分观点认为这是国产大模型新一轮价格战的延续,也有人将其解读为小米在利润承压背景下通过“烧钱”抢占市场的策略,更有声音指出这是受DeepSeek行业定价基准调整的影响。

面对外界质疑,MiMo负责人罗福莉通过技术博客详细拆解了降价背后的工程逻辑。她强调,此次降价并非营销手段,而是基于真实技术突破的成本优化结果。核心在于针对用户长对话中重复读取历史上下文的场景(Input Cache Hit),通过工程创新将这部分成本压缩至接近零,从而支撑99%的折扣力度。

具体而言,MiMo团队通过六大工程实现降本:首先,重构模型架构,将70层中的60层改为滑动窗口注意力机制(SWA),仅保留10层处理全部历史,使KVCache(模型短期记忆)体积压缩至传统架构的1/7;其次,开发双池显存分配系统,为SWA层和全注意力层分别分配独立显存池,避免空间浪费,使单GPU并发用户数提升5倍;第三,优化前缀缓存命中规则,引入“窗口安全长度”机制,确保复用数据的有效性,线上实测命中率达93%-95%。

在存储环节,团队自研GCache分布式缓存系统,直接利用GPU机器自带SSD存储数据,消除额外存储成本,同时延长缓存存活时间,进一步提升命中率。调度系统方面,通过亲和路由、长度分桶和TTFT优化策略,将L2缓存命中率提升25%,单机吞吐量提高30%,长请求延迟降低30%。最后,模型原生支持多token预测(MTP),在生成阶段实现2.3倍加速,降低输出成本,形成完整的降本闭环。

罗福莉在博客中指出,MiMo-V2.5的推理效率提升源于多维度协同优化。例如,Hybrid SWA架构需配合重构的KVCache管理、分级缓存和调度策略,才能将理论优势转化为实际性能。团队还通过MoE配置和多模态推理优化,进一步提升了线上服务能力。这一系统性工程打法,为行业提供了可复制的降本范式。

行业分析认为,小米此次降价虽与市场环境有关,但核心逻辑在于通过技术突破重构成本结构。当95%的重复读取请求无需计算,且存储、调度等环节成本趋近于零时,即使定价下降99%,模型仍能保持正向毛利率。这种“技术驱动降价”的模式,与单纯依赖补贴的价格战形成本质区别。

更多热门内容
国产AI大模型掀起降价潮:DeepSeek与小米领衔,行业生态面临新考验
小i说:最近国产AI这波降价潮确实太猛了,DeepSeek和小米接连把API价格打到“地板价”,在全球算力成本飙升的大背景下,这种逆市操作看着确实亮眼。盲目低价也容易模糊行业的定价体系,万一有厂商为了压缩成…

2026-05-31

易车实测小米SU7Pro:真实路况续航达87%,纯电出行顾虑一扫而空
在新能源汽车市场,续航能力一直是消费者最为关注的焦点。近日,易车对小米SU7Pro进行了专业的续航实测,结果显示在真实路况下,该车续航达成率高达87%,这一成绩不仅令人振奋,更在同级别纯电车型中名列前茅。这次…

2026-05-31

易车实测小米SU7Pro:真实路况续航达成率87% 展现硬核实力
在新能源汽车市场中,续航能力一直是车主和潜在买家关注的焦点。近期,易车对小米SU7Pro进行了全面的续航实测,结果显示该车在真实路况下的续航达成率高达87%。小米SU7Pro的表现证明了其电池管理系统和电驱系…

2026-05-31

易车实测小米SU7Pro续航:真实路况达成率87%,硬实力获市场认可
在新能源汽车市场,续航能力一直是车主和准车主们关注的焦点。这一数字在当前市场中属于第一梯队,尤其是在许多纯电车型的综合续航达成率普遍维持在70%至80%之间的情况下,小米SU7Pro的表现尤为突出。许多车企在…

2026-05-31

小米汽车YU7系列深度揭秘:空调、天际屏、车身材质亮点全呈现
小米汽车在其最新一期的“答网友问”中,针对YU7系列车型的配置细节进行深入解读,重点涵盖了用户关注的空调模式、天际屏功能及车身材质等方面。特别值得注意的是,YU7系列全系车型均使用行业量产中最高强度的2200…

2026-05-31