ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

月之暗面Kimi-Dev-72B开源,刷新全球AI软件工程基准测试成绩!

时间:2025-06-17 15:44:58来源:ITBEAR编辑:快讯团队

近期,AI领域迎来了一项重大突破,月之暗面团队正式推出了其最新研发的开源代码大模型——Kimi-Dev-72B。这款模型在软件工程基准测试SWE-bench Verified中取得了令人瞩目的成绩,以60.4%的准确率刷新了全球开源模型的最高纪录。

据了解,Kimi-Dev-72B是专为软件工程任务量身打造的,尽管其参数量仅为720亿,但在SWE-bench Verified测试中,却成功超越了近期发布的DeepSeek-R1-0528模型。后者虽然拥有高达6710亿的参数量,但在此次测试中仅以57.6%的准确率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能够在测试中脱颖而出,得益于其采用的大规模强化学习训练方法。该模型能够在真实的代码环境中自动修复Docker存储库,并且只有在完整测试套件通过后才给予奖励。这种训练方式极大地提升了模型输出的正确性和鲁棒性,使其更加贴合实际的软件开发标准。

Kimi-Dev-72B的模型权重和源代码已经全面开源,并在Hugging Face与GitHub平台上向开发者社区开放下载和部署。这一举措无疑将极大地推动软件工程领域的发展,为开发者们提供更加高效、智能的工具。

更多热门内容
科大讯飞融资热度不减,三日吸金1.85亿,融券净买入2.58万股
6月18日,沪深两融数据显示,科大讯飞获融资买入额0.55亿元,居两市第283位,当日融资偿还额0.63亿元,净卖出879.58万元。 最近三个交易日,16日-18日,科大讯飞分别获融资买入0.59亿元、0.…

2025-06-19