在人工智能领域,一场静水深流的大模型竞赛正在激烈上演。尽管AI应用遍地开花,但基础大模型的战场非但没有平息,反而愈发白热化。
据统计,自2025年初以来,中国的主要大模型参与者如百度、字节、阿里、DeepSeek以及被誉为“六小虎”的其他团队,已经推出了超过45款基础大模型,平均不到四天就有一款新模型问世。这一速度远超外界预期,显示出行业竞争的激烈程度。
在这场竞赛中,国内大模型公司的第一梯队正逐步逼近海外顶尖阵营的格局。海外以OpenAI、Google、Anthropic、X.AI和meta组成的“五强”为标杆,国内则形成了由阿里、字节、DeepSeek、阶跃星辰和智谱构成的“3+2”组合,被誉为国内的“新基模五强”。
上半年,这五家公司共发布了32个大模型,其中阿里和阶跃星辰尤为突出,分别发布了9款和11款模型,占据了发布总数的半壁江山。这些公司的竞争不仅体现在数量上,更在于模型的质量和创新性。
从行业趋势来看,开源、推理和多模态成为关键词。阿里作为开源的积极倡导者,自2023年起就将旗下多款模型发布在开源社区,成为多个领域的开源SOTA提供者。其混合推理模型Qwen3更是以低成本高性能成为全球最强的开源模型之一。
DeepSeek则以推理大模型著称,其发布的DeepSeek R1在性能和成本上均表现出色,成为后续推理大模型的标杆。该公司专注于推理领域,不做大模型矩阵,以专才身份在竞争中脱颖而出。
多模态大模型则是今年大模型公司的研发重点。阶跃星辰被誉为“多模态卷王”,其发布的多模态模型数量高达16个,其中包括全球范围内参数量最大、性能最好的开源视频生成大模型Step-Video-T2V。字节也在多模态领域表现出色,其文生图模型Seedream 3.0在画质、生成效率以及商业化应用能力上均有显著提升。
尽管大语言模型已经取得了显著进展,但多模态大模型的发展仍然面临挑战。行业内缺少多模态领域的理解生成一体化架构,导致多模态模型的理解和生成仍然由不同的模型完成。然而,这并不意味着多模态领域没有机会,相反,它仍然有可能迎来下一个爆款模型。
在AI应用落地如火如荼的今天,继续押注基础大模型的价值仍然不容忽视。DeepSeek的发布无疑给行业注入了新的活力,证明了模型能力提升带来的技术红利。为了保持竞争力,大厂和创业公司都在积极抢钱、抢人才。
算力、人才和资金是衡量大模型公司实力的三个硬指标。大厂在资金上相对充沛,而创业公司则需要通过融资来支撑前期的研发。智谱和阶跃星辰作为被国资看好的企业,能够在寒冬期持续获得资本青睐,为它们的发展提供了有力保障。
在人才方面,“基模五强”正在展现对人才的虹吸效应。以字节为例,该公司近年来挖走了多位海内外研发骨干,为团队注入了新鲜血液。这些公司在资金和人才的堆积下,逐渐建立了各自的优势。
商业化方面,开源和垂类场景应用成为大模型公司的两个关键方向。开源的中国大模型已经在全球占据了重要地位,在开源社区HuggingFace上,前30的热门模型中有12个来自中国公司。开源之后,大模型公司可以尝试多种商业化手段,如调用API付费、提供GPU服务以及定制化调整和技术服务等。
垂类场景应用方面,智能体(Agent)成为热门方向。智能体在政企、金融、医疗等领域无处不在,与智能终端的结合更是成为关键落地方向。长城汽车CTO吴会肖表示,汽车等高价值软硬件系统与用户密切联系,成为理想的AI载体。同样,手机、具身智能等产品也成为智能体的重要应用场景。
阶跃星辰和智谱等大模型公司纷纷瞄准智能终端赛道,推出了能够在手机端运行的智能体以及Agent在汽车、手机、具身智能、IoT等领域的应用。这些合作不仅提升了智能终端产品的卖点,也为企业带来了可观的收入。