ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

快手Kwaipilot开源“AutoThink”大模型,深度思考不再“过度”

时间:2025-06-04 17:40:14来源:ITBEAR编辑:快讯团队

近日,快手Kwaipilot团队宣布了一项技术突破,他们开源了一款名为KwaiCoder-AutoThink-preview的自动思考大模型。这款模型是团队针对当前深度思考大模型普遍存在的“过度思考”问题,进行深入研究后取得的成果。

为了解决这一问题,Kwaipilot团队提出了一种创新的自动思考模型训练范式,并基于传统的强化学习算法GRPO,进一步研发了带有过程监督的强化学习方法Step-SRPO。这一新方法旨在提升模型在复杂任务中的表现,使其能够更加智能地应对各种挑战。

KwaiCoder-AutoThink-preview模型的最大特点在于,它融合了“思考”与“非思考”两种能力,被形象地称为“DeepSeek-V3 & R1 合体”。这款模型能够根据问题的难易程度,自动切换思考形态,从而在不同类型的任务中展现出卓越的性能。在多个评测榜单上,这款模型在“思考”和“非思考”模式下均取得了显著的性能提升,特别是在代码和数学类任务上,自动思考模式下的模型得分提高了近20分。

值得注意的是,即使在未开启思考模式的情况下,这款模型也展现出了不俗的性能。这得益于其更优的推理形态,使得模型在部分榜单中的性能有了小幅度的提升。这一发现无疑为深度学习领域带来了新的启示,也展示了Kwaipilot团队在技术研发方面的深厚实力。

据快手技术团队介绍,他们将继续基于preview版本模型进行研发,进一步增强其推理能力和支持更完善的思考中工具使用能力。同时,他们也承诺将全部技术细节和训练方法开源,为深度学习领域的研究者提供更多的参考和借鉴。这一举措无疑将推动深度学习技术的进一步发展,为人工智能领域的创新注入新的活力。

更多热门内容
快手可灵AI:能否挑起“养家”大梁,成第二增长曲线?
即,“可灵AI已经广泛应用于广告营销、短剧和智能终端等多个行业,这也使得我们对于可灵AI成为新AI时代视频创作的基础设施的愿景更有信心。”快手CFO金秉在财报电话会议中表示,可灵AI已经在推理层面实现了边际…

2025-06-05

游戏大厂AI角逐:腾讯、米哈游、网易如何重塑游戏产业?
这款游戏以AI多模态交互为核心亮点,玩家能与被困外星星球的女生Stella进行文字、语音甚至视频实时对话;网易伏羲实验室则陆续推出虚拟人、智能捏脸、智能创作等一系列技术,并将其植入网易旗下的《倩女幽魂》《永劫…

2025-06-05

淘宝Vision进军线下,未来旗舰店首店已在阿里总部试运行
新榜讯财联社6月5日消息,淘宝旗下空间购物应用“淘宝Vision”计划于今年进军线下领域,目前正筹备一个未来旗舰店项目,旨在进一步融合线上沉浸式购物体验与线下商业模式。 据接近淘宝的业内人士透露,“淘宝Vi…

2025-06-05

淘宝Vision线下布局新动作:未来旗舰店试运行,3D数字人导购亮相
据新浪科技,淘宝空间购物应用“淘宝Vision”今年将进军线下,正在酝酿一个未来旗舰店项目,把线上沉浸式购物体验和线下商业模式做进一步融合。 接近淘宝的业内人士向新浪科技独家透露,“淘宝Vision未来旗舰店…

2025-06-05