近期,AI领域迎来了一波新的热潮,这一切皆源于月之暗面(Moonshot AI)所开源的万亿参数MoE模型——Kimi K2。7月11日,这款参数高达1T、激活参数32B的模型横空出世,迅速吸引了全球开发者的目光。
Kimi K2并非只有规模上的震撼,其独特之处在于对编程和智能体类任务的卓越表现。据Kimi公布的测评结果显示,Kimi K2在自主编程、工具调用和数学推理三个维度上,均超越了同为开源模型的DeepSeek-V3和阿里Qwen3。这一成绩无疑为Kimi K2赢得了业界的广泛认可。
开源后的Kimi K2,其下载量在Hugging Face平台上迅速攀升,一周内便突破了10万次。同时,在大型语言模型权威竞技场LMSYS中,K2-Instruct也取得了显著成绩,位列总榜第四,仅次于GPT-4o、Claude-3.5和Gemini-1.5-Pro。马斯克在推特上转发的OpenRouter趋势数据显示,K2在一周内便攀升至全球趋势榜第二,仅次于Grok 4。
与以往不同,月之暗面此次开源并未选择大规模营销,而是采取了更为低调的方式。Kimi的算法工程师和研究员在推特、小红书、知乎等社交平台上积极分享K2的工作和技术,回复用户疑问。这种真诚的互动引发了更多开发者的关注和赞誉,其中就包括Hugging Face联合创始人Thomas Wolf,他对Kimi K2大加赞赏,认为开源模型正在挑战最新的闭源权重模型。
Kimi的这次开源热潮,与其过去半年的低调形成了鲜明对比。在过去两年中,Kimi经历了过山车般的起伏。虽然几乎是最后一个推出ChatBot助手,但凭借着长文本和出色的策划,Kimi一炮而红,成为了最先出圈的大模型应用产品。然而,随着DeepSeek等强劲对手的出现,Kimi也面临了巨大的挑战。
为了应对这些挑战,Kimi选择了蛰伏,并专注于模型的提升。To C的Kimi应用停止了投流,转而主攻模型研发。同时,其他C端应用以及多模态上的尝试也被迅速暂停。这一系列举措虽然引发了质疑,但也为Kimi的翻身仗奠定了基础。K2的发布,正是Kimi回归AGI主线的一次有力宣言。
K2的发布不仅引起了全球开发者社区的震动,还被誉为“另一个DeepSeek时刻”。《Nature》杂志的发文更是对K2给予了高度评价。K2之所以如此重要,是因为它不仅主打高性能、低成本,而且真正做到了开源。更重要的是,K2在智能体类任务上展现出了强悍的性能。
Kimi的算法工程师Justin Wong在博客中提到,Kimi希望将人与AI的交互方式从chat-first转变为artifact-first,即交付一个具体的成果物,而非一段聊天上下文。这种转变使得K2在自主使用工具、完成任务的能力上得到了显著提升。因此,在K2的使用案例中,我们可以看到它迅速生成3D旋转地球模型、PPT、昼夜循环的山川峡谷3D景观等成果。
K2还将模型的训练和使用成本降低到了一个新的水平,同时保持着接近Claude主流模型的性能。这使得K2在性价比上具有了极大的优势。Kimi K2 API的定价相较于同样主打编程的Claude 4 Sonnet的API价格,整体成本可以下降超过75%。这一优势吸引了大量开发者,使得K2在发布后迅速登上了OpenRouter的趋势榜周第二。
尽管K2目前还存在一些不足,如Token输出较为啰嗦、代码质量与顶尖Claude相比仍有差距等,但其高性价比已经足以让许多开发者为之倾倒。许多博主的测试案例中显示,普通程序员使用K2进行一天的开发工作,所需费用仅几块钱,这大大降低了AI编程的算力使用门槛。
K2的成功也得益于Kimi在技术创新上的冒险。Kimi从训练阶段引入了新的优化器Muon,取代了原来主流的AdamW优化器。这一创新使得Muon在不同Llama架构模型上的算力需求只有AdamW的52%。这一冒险不仅成功了,还使得K2在发布时备受尊重。
如今,面对DeepSeek等强劲对手以及大厂在AI领域的全面布局,大模型初创公司的路似乎只有一条:开源并攻克最难的问题。Kimi的选择无疑为其他初创公司提供了借鉴。K2的爆火已经为Kimi带来了实实在在的回报:全球开发者开始关注这个充满朋克文化的团队,并对其未来发展充满期待。