ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

月之暗面Kimi-Dev-72B开源,刷新全球AI软件工程基准测试成绩!

时间:2025-06-17 15:44:58来源:ITBEAR编辑:快讯团队

近期,AI领域迎来了一项重大突破,月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩,以60.4%的准确率刷新了全球开源模型的最高纪录。

据了解,Kimi-Dev-72B是专为软件工程任务量身打造的,尽管其参数量仅为720亿,但在SWE-bench Verified测试中,却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量,但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能够在测试中脱颖而出,得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库,并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性,使其更加贴合实际的软件开发标准。

Kimi-Dev-72B的模型权重和源代码已经全面开源,并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展,为开发者们提供更加高效、智能的工具。

更多热门内容
2025年:中国芯片企业借AI浪潮,破局重生
2025年是AI应用的爆发年,也是关乎国产算力企业兴衰存亡的关键之年。现在真正做到了芯片、模型助力场景应用,场景反馈回来的数据,又增加了模型跟芯片进一步地迭代,形成了一个非常良性的正向循环。”我们从芯片厂商的…

2025-08-04