在AI领域,一场无声的竞争正在激烈上演。曾经被誉为“AI六小虎”的智谱、月之暗面、百川智能、MiniMax、阶跃星辰、零一万物等初创企业,如今已面临重新洗牌的局面。特别是随着零一万物和百川智能的战略调整,放弃大参数模型的深入研发,转向应用领域,使得“六小虎”的阵容缩减至“四小强”。
为了在这场技术马拉松中保持领先,月之暗面、MiniMax和智谱纷纷加快了底座大模型的更新步伐。其中,智谱的表现尤为抢眼,一口气推出了六款大参数模型,特别是GLM-4.5,在推理、代码生成以及智能体综合能力上均取得了开源模型的顶尖水平,被誉为当前最佳(SOTA)。
紧接着,智谱再次发力,推出了号称“全球100B级效果最佳的开源视觉推理模型”GLM-4.5V,总参数达到106B,激活参数为12B,这一成果标志着智谱在通向通用人工智能(AGI)的道路上又迈出了坚实的一步。
然而,智谱的崛起之路并非一帆风顺。在DeepSeek横空出世之前,智谱凭借顶尖的研发背景和先发优势,一度稳坐大模型创业公司的头把交椅。但随着融资环境和行业竞争格局的变化,智谱也面临了前所未有的挑战。特别是在DeepSeek爆火之后,智谱等企业在大模型解决方案市场的份额逐渐被稀释。
为了应对这一挑战,智谱此次发布的GLM-4.5可谓是做足了准备。该模型在推理、编码和智能体能力上实现了原生融合,既擅长写代码也擅长推理,能够满足多种应用场景的需求。发布后,GLM-4.5在多个评测基准中取得了优异成绩,综合平均分位居全球模型第三、国产模型第一、开源模型第一。
智谱在发布会上还展示了GLM-4.5构建的多款应用,如社交媒体网站、Flappy Bird小游戏等,其中最引人注目的莫过于“一句话生成搜索引擎”。用户只需在智谱AI官网输入提示词,GLM-4.5就能在极短时间内生成一个可以正常使用的搜索引擎。
编程能力正逐渐成为国内大模型的“标配”。今年以来,不仅智谱推出了GLM-4.5这样的编程强模型,月之暗面也推出了针对软件工程任务的开源代码大模型Kimi-Dev-72B,阿里也开源了其最新一代旗舰编程模型Qwen3-Coder。开发者们对于提升代码效率的工具有着强烈的付费意愿,因此满足这部分刚需人群的需求成为了大模型接下来的发展重点之一。
在成本效率方面,智谱的GLM-4.5也实现了突破。API调用价格百万tokens低至0.8元(输入)和2元(输出),这一价格优势使得GLM-4.5在市场上更具竞争力。有开发者用户表示,购买了一个50元的资源包后,用了好几天还不到2000万token,性价比极高。
尽管智谱在技术和产品上取得了显著进展,但大模型技术竞赛还远未到达终点。DeepSeek的出现让智谱等竞争对手感受到了巨大的压力。智谱CEO张鹏曾在全员信中表示,要加大投入,不断追求更大更强的模型,持续提升基座模型的性能。这也意味着,未来智谱仍需更多的资金和算力来支持其底座模型的研发。
在融资方面,智谱虽然一直备受投资机构青睐,但AI赛道的投融资环境正在收紧。靖亚资本发布的报告显示,2024年AI赛道的融资额同比下降了14.2%。尽管智谱今年以来已经进行了多轮融资,总计超30亿元,但面对高昂的研发费用和激烈的市场竞争,智谱的现金流压力仍然不小。
在此境况下,智谱正式启动了IPO进程,拟同时推进A股和港股上市。据称,智谱已在北京证监局办理辅导备案,由中金公司辅导,计划在今年10月完成辅导计划。IPO成功后,智谱将能够获得更多的资金支持,以应对未来的挑战。
然而,商业化变现仍然是智谱面临的一大难题。尽管智谱在B端市场取得了不错的成绩,为多家企业提供了私有化部署服务,但B端定制业务需要反复调试,交付周期较长,规模复制性较差。而在C端市场,智谱的搜索问答APP“清言”虽然月活过千万,但面对激烈的市场竞争和有限的用户付费意愿,智谱在C端市场的增长也面临挑战。
智谱还在发力覆盖B端和C端的Agent产品。但受限于MCP协议等因素和模型本身的能力,打造有破圈效应的Agent难度远高于AI搜索应用。同时,百度、字节等大厂也已经推出了各自的智能体产品,使得智谱在Agent领域的竞争更加激烈。
更令人忧心的是,从2024年开始,智谱的技术、融资、商业化等业务负责人陆续出走,加入大厂或自行创业。如何在人才持续流失的情况下保持公司的稳定和创新性,对这家成立刚满6年的AI企业而言同样是不小的挑战。