小米MiMo对标DeepSeek发起价格战，借势突围能否赢得生态入场券？-业界动态-ITBear科技资讯

国产大模型市场正经历一场由价格引发的深刻变革。小米近日宣布将MiMo-V2.5系列API价格永久下调，其中Pro版输入缓存命中价格降至0.025元/百万tokens，未命中场景输入价格为3元/百万tokens，输出价格为6元/百万tokens；普通版缓存命中价格更低至0.02元，未命中输入和输出分别为1元和2元。这一调整并非简单的市场促销，而是直接对标行业标杆DeepSeek的定价策略，标志着国产大模型竞争进入精细化成本管控的新阶段。

价格调整背后折射出大模型技术架构的深层进化。小米团队在公告中透露，此次降价得益于SGLang HiCache框架对Sliding Window Attention（SWA）的完整支持，通过优化KV Cache在GPU显存、CPU内存和SSD之间的调度效率，将数据搬运量降至原有水平的1/7，同时使可缓存token数量提升近5倍。这种技术突破使得缓存命中场景的成本出现断崖式下跌——以MiMo-V2.5-Pro为例，缓存命中输入价格较未命中场景低120倍，这种差异化定价策略精准匹配了Agent应用、代码生成等长上下文场景的特殊需求。

DeepSeek在此轮竞争中扮演着关键角色。其通过持续降价重新定义了行业价格基准，迫使其他厂商必须在性价比维度给出明确回应。对于尚未建立规模优势的新入局者而言，价格对标成为获取开发者注意力的有效手段。以小米MiMo为例，其核心用户群体并非独立模型调用方，而是手机、汽车、IoT等生态内的开发者。通过将价格压至与DeepSeek同一水平线，小米试图打破开发者对既有模型的路径依赖，为模型进入智能硬件控制、车机交互等场景创造入口。

技术团队面临的挑战在于平衡价格与可持续性。小米方面透露，当前定价策略下生产推理引擎已接近满负荷运转，但通过架构优化仍能维持收支平衡。这种谨慎态度源于对行业规律的深刻认知——此前有专家警告盲目降价可能导致亏损，但小米认为当模型架构与推理基础设施形成协同优化时，成本压缩可以转化为竞争优势。据悉，团队将在近期发布技术论文，详细阐述多级存储调度、专家并行计算等创新方案的具体实现路径。

这场价格博弈正在重塑国产大模型的市场格局。对于头部厂商而言，需要证明自身在性能、生态或稳定性方面的不可替代性；对于后来者，则必须抓住价格窗口期积累真实调用数据，为模型迭代提供养分。小米的选择折射出生态型企业的特殊逻辑——模型API只是中间形态，最终要融入智能硬件的交互体系。这种战略定位决定了其必须通过极致性价比获取初始流量，再通过生态协同实现价值闭环。当前的价格战或许只是序章，真正的较量将在数据反馈与模型优化的闭环中展开。