月之暗面Kimi-Dev-72B开源，刷新全球AI软件工程基准测试成绩！-人工智能-ITBear科技资讯

近期，AI领域迎来了一项重大突破，月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩，以60.4%的准确率刷新了全球开源模型的最高纪录。

据了解，Kimi-Dev-72B是专为软件工程任务量身打造的，尽管其参数量仅为720亿，但在SWE-bench Verified测试中，却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量，但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能够在测试中脱颖而出，得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库，并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性，使其更加贴合实际的软件开发标准。

Kimi-Dev-72B的模型权重和源代码已经全面开源，并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展，为开发者们提供更加高效、智能的工具。