ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Kimi K2问鼎全球开源榜首,中国AI模型再创新辉煌

时间:2025-07-19 03:54:34来源:ITBEAR编辑:快讯团队

在AI竞技场上,一款名为Kimi K2的开源模型近日掀起了一场不小的风波。据最新消息,Kimi K2在激烈的竞争中脱颖而出,成功超越了DeepSeek,荣登全球开源模型榜首,同时跻身总榜第五,与马斯克旗下的顶尖闭源模型Grok 4并驾齐驱。

这一消息迅速在国际网络上引发热议,评论区瞬间变成了赞美与打卡的海洋。网友们纷纷对Kimi K2的出色表现表示惊叹,并对其未来的发展寄予厚望。而竞技场也适时更新了Kimi K2的排名情况,让这一壮举得以正式确认。

Kimi K2不仅在综合排名上表现出色,其在各项单项能力上同样不容小觑。在多轮对话能力测试中,它与一众闭源模型平分秋色,并列第一;在编程能力上,它紧随GPT 4.5和Grok 4之后,位居第二;在应对复杂提示词的能力上,它也展现出强大的实力,与o3、4o等模型处于同一梯队。

值得注意的是,Kimi K2并非孤军奋战。在总榜TOP 10中,另外一款来自中国的开源模型DeepSeek R1也占据了一席之地,位列第八。这两款国产开源模型的崛起,无疑为全球AI领域注入了新的活力。

Kimi K2的热度在过去一周内持续攀升。据公开数据显示,该模型在GitHub上获得了5.6K的标星,在Hugging Face平台上的下载量更是接近10万。AI搜索引擎明星创企Perplexity的CEO也亲自为Kimi K2站台,并透露该模型在内部评估中表现出色,Perplexity计划基于K2模型进行后续训练。

然而,随着Kimi K2的走红,关于其是否采用了DeepSeek V3架构的质疑声也随之而来。对此,Kimi团队成员给出了明确回应。他们表示,Kimi K2确实继承了DeepSeek V3的架构,但在此基础上进行了一系列参数调整,以更好地适应自身需求。

具体来说,Kimi K2在结构参数上进行了四点改动:增加了专家数量,以在激活参数量不变的情况下降低loss;将注意力头head数减半,以节省成本;只保留第一层的Dense结构,其余层均采用MoE结构,对推理几乎无影响;专家无分组,通过自由路由和动态重排来应对负载不均衡问题,同时提高模型的灵活性和能力。

经过这些调整,Kimi K2在相同专家数量下,虽然总参数增大到1.5倍,但理论上的prefill和decode耗时都更小。即使考虑与通信overlap等复杂因素,这一方案也不会比V3有显著的成本增加。可以说,这是一种既精打细算又高效的结构调优。

随着Kimi K2的崛起,开源模型与闭源模型之间的界限变得越来越模糊。以往,“开源=性能弱”的刻板印象正在被打破。如今,开源模型在榜单上的整体排名不断上升,与闭源模型的分数差距也越来越小。在TOP 10榜单中,开源模型和闭源模型的总分均超过了1400分,几乎站在了同一起跑线上。

而Kimi K2作为开源模型的佼佼者,其总分已经非常接近Grok 4、GPT 4.5等顶尖闭源模型。这一趋势表明,随着开源力量的不断崛起,我们或许将不再需要在模型能力和成本之间做出取舍。越来越多的行业人士也开始认同这一观点,认为开源模型将在全球AI能力的扩散中扮演越来越重要的角色。

更多热门内容