微博15亿参数小模型VibeThinker：7800美元成本，数学赛场逆袭“大块头”-人工智能-ITBear科技资讯

当全球AI领域陷入“参数至上”的激烈竞争时，微博AI团队以一场颠覆性突破，为行业开辟了全新的发展路径。近日，微博正式推出自主研发的开源大模型VibeThinker，这款仅含15亿参数的“轻量级选手”，在国际权威数学竞赛基准测试中，以惊人表现击败了参数规模达6710亿的DeepSeek R1模型，引发全球AI研究界的广泛关注。

在传统认知中，AI模型的参数量被视为衡量其能力的核心指标。行业普遍认为，复杂推理能力需要千亿级参数支撑，小模型因参数不足难以应对高难度任务。然而，微博AI团队通过优化模型架构与训练范式，创新提出“频谱到信号原理”（SSP）训练方法，成功挖掘出小模型的隐藏潜力。VibeThinker在AIME24、AIME25及HMMT25等高难度数学测试中，表现超越参数量超其400倍的DeepSeek-R1-0120版本，与4560亿参数的MiniMax-M1效果相当，甚至可媲美Gemini 2.5 flash和Claude Opus 4等顶尖模型。在编程算法测试集LiveCodeBench v6中，其成绩也追平了欧洲领先AI企业Minstral.AI的Magistral-Medium-2506版本。

这一突破不仅重新定义了AI模型的评价标准，更以极致的成本效益颠覆了行业格局。据公开数据，2025年主流大模型单次后训练成本普遍在数十万美元级别。例如，上海AI企业MiniMax今年6月发布的M1模型，训练成本约53.5万美元；DeepSeek的R1模型训练总成本（含基础模型开发）约630万美元。相比之下，VibeThinker的后训练过程（含SFT和RL阶段）仅消耗3900个GPU小时，按市场租赁价格计算，总成本仅7800美元，成本效益比达到30至60倍。这一优势意味着，前沿AI技术不再为科技巨头所垄断，中小型机构和研究团队也能以极低门槛参与创新，推动行业向更开放、多元的方向发展。

技术突破的最终价值在于落地应用。微博已将AI技术深度融入平台生态，构建起覆盖多场景的智能服务体系。2024年，微博自主研发的“知微”大语言模型通过备案，并陆续推出智搜、内容总结、AI互动号等功能。其中，微博智搜通过分析平台海量内容构建可信知识图谱，实现精准需求捕捉与情感场景理解，6月月活跃用户突破5000万；评论罗伯特作为AI互动账号，从毒舌风格进化出温情与聪明版本，全网粉丝近200万，成为用户热议的交流对象。

随着VibeThinker的发布，微博AI战略迈入新阶段。公司计划深度融合心理等垂直领域的数据资产，打造更懂公众情绪、更能服务社会需求的专属模型。这一模型不仅将优化现有AI产品体验，更可能裂变出兼具社交属性与智能服务的全新生态。例如，VibeThinker的技术有望降低微博智搜的算力损耗和实时互动场景的AI响应成本，使平台在规模化投入AI能力时无需承担过高资源压力，进一步释放生态创新能力。

目前，VibeThinker仍处于实验性版本阶段，其研发重点聚焦于强化小模型在数学与编程领域的能力，尚未针对日常聊天等场景进行优化。但这一探索已为AI产业提供了全新思路：通过算法创新而非单纯堆砌参数，小模型同样能实现高性能与低成本的双赢，为行业从“规模竞赛”转向“效率革命”奠定基础。

陈天桥撰文：智能体崛起，传统管理或退场，企业范式迎根本转变

2025-12-01

孙正义首谈清空英伟达：含泪抛售，只为加码AI领域投资布局

2025-12-01

DeepSeek-V3.2及增强版发布：推理能力比肩GPT-5 工具调用能力再升级

2025-12-01

DeepSeek发布V3.2系列模型：开源领域再突破，推理性能直追顶尖闭源模型

根据技术报告，V3.2在智能体评测中达到当前开源模型最高水平，大幅缩小了开源模型与闭源模型在工具调用能力上的差距。 DeepSeek-V3.2的目标是平衡推理能力与输出长度，适合日常使用，例如问答场景和通…

2025-12-01

豆包手机助手技术预览版亮相，AI深度融入手机开启新交互时代

实际演示视频显示，豆包手机助手已能在语音和侧边AI键唤醒下直接读取屏幕内容、对照片进行多模态理解、自动完成跨平台比价下单、远程控制汽车、在企业系统发起请假或报销流程，并在激活记忆功能后以更少询问完成复杂链式…

2025-12-01

特斯拉前技术骨干“集结”Sunday Robotics，首款家用机器人Memo登场

【环球网科技综合报道】12月1日消息，据businessinsider报道，新兴机器人初创公司Sunday Robotics于11月19日正式结束隐秘运营状态，并发布了其首款家用机器人产品“Memo”，同时披…

2025-12-01

深度体验豆包手机助手：AI赋能下，开启手机智能操作新体验

2025-12-01

前商汤核心刘宇再创业：10个月估值超13.2亿，红杉IDG押注多模态AI新赛道

2025-12-01

夏威夷启动“Eyes on the Road”计划：AI行车记录仪助力道路安全与规范驾驶

2025-12-01

前苹果机器人研究员Yilun Chen转投特斯拉，加入Optimus团队盛赞其能量与信念

2025-12-01