ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

小米MiMo对标DeepSeek发起价格战,借势突围能否赢得生态入场券?

时间:2026-05-28 17:35:23来源:互联网编辑:快讯

国产大模型市场正经历一场由价格引发的深刻变革。小米近日宣布将MiMo-V2.5系列API价格永久下调,其中Pro版输入缓存命中价格降至0.025元/百万tokens,未命中场景输入价格为3元/百万tokens,输出价格为6元/百万tokens;普通版缓存命中价格更低至0.02元,未命中输入和输出分别为1元和2元。这一调整并非简单的市场促销,而是直接对标行业标杆DeepSeek的定价策略,标志着国产大模型竞争进入精细化成本管控的新阶段。

价格调整背后折射出大模型技术架构的深层进化。小米团队在公告中透露,此次降价得益于SGLang HiCache框架对Sliding Window Attention(SWA)的完整支持,通过优化KV Cache在GPU显存、CPU内存和SSD之间的调度效率,将数据搬运量降至原有水平的1/7,同时使可缓存token数量提升近5倍。这种技术突破使得缓存命中场景的成本出现断崖式下跌——以MiMo-V2.5-Pro为例,缓存命中输入价格较未命中场景低120倍,这种差异化定价策略精准匹配了Agent应用、代码生成等长上下文场景的特殊需求。

DeepSeek在此轮竞争中扮演着关键角色。其通过持续降价重新定义了行业价格基准,迫使其他厂商必须在性价比维度给出明确回应。对于尚未建立规模优势的新入局者而言,价格对标成为获取开发者注意力的有效手段。以小米MiMo为例,其核心用户群体并非独立模型调用方,而是手机、汽车、IoT等生态内的开发者。通过将价格压至与DeepSeek同一水平线,小米试图打破开发者对既有模型的路径依赖,为模型进入智能硬件控制、车机交互等场景创造入口。

技术团队面临的挑战在于平衡价格与可持续性。小米方面透露,当前定价策略下生产推理引擎已接近满负荷运转,但通过架构优化仍能维持收支平衡。这种谨慎态度源于对行业规律的深刻认知——此前有专家警告盲目降价可能导致亏损,但小米认为当模型架构与推理基础设施形成协同优化时,成本压缩可以转化为竞争优势。据悉,团队将在近期发布技术论文,详细阐述多级存储调度、专家并行计算等创新方案的具体实现路径。

这场价格博弈正在重塑国产大模型的市场格局。对于头部厂商而言,需要证明自身在性能、生态或稳定性方面的不可替代性;对于后来者,则必须抓住价格窗口期积累真实调用数据,为模型迭代提供养分。小米的选择折射出生态型企业的特殊逻辑——模型API只是中间形态,最终要融入智能硬件的交互体系。这种战略定位决定了其必须通过极致性价比获取初始流量,再通过生态协同实现价值闭环。当前的价格战或许只是序章,真正的较量将在数据反馈与模型优化的闭环中展开。

更多热门内容
突破256K超长上下文瓶颈,快手Keye-VL-2.0刷新多模态推理能力边界
近日,快手正式发布了新版多模态大模型Keye-VL-2.0-30B-A3B。作为Keye家族最新一代的30B级主力基座,Keye-VL-2.0-30B-A3B率先将DSA(DeepSeek Sparse Attention)机制引入多模态理解场景,成功解锁了256K超长上下文的深度感知,在长视频时序感知上实现了几乎无损的推理能

2026-05-28

助力教育数字化发展,快手公益启动“启智星”计划AI赋能教育创新案例征集
为响应党的二十大关于“实施教育数字化战略行动”的部署,落实教育部《关于加强中小学人工智能教育的通知》要求,快手公益基金会正式启动“启智星”计划AI赋能教育创新案例征集活动,面向全国一线教师及基层教育工作者,征集将人工智能技术应用于教育教学实践的优秀案例

2026-05-28

快手2027快Star顶尖技术人才计划启动,技术高管带教、前沿业务场景助力青年人才成长
人才是创新发展的根基。在AI人才竞争持续升温的背景下,近日,快手正式启动2027届“快Star顶尖技术人才计划”,面向全球优秀2027届应届生与毕业两年内的年轻技术人才开放招募,覆盖从大模型相关前沿方向,到音视频、推荐、广告、搜索等快手核心业务引擎。作为快手重点打

2026-05-28