大模型新赛点：“新基模五强”激战正酣，谁将问鼎巅峰？-智能汽车-ITBear科技资讯

在人工智能领域，一场静水深流的大模型竞赛正在激烈上演。尽管AI应用遍地开花，但基础大模型的战场非但没有平息，反而愈发白热化。

据统计，自2025年初以来，中国的主要大模型参与者如百度、字节、阿里、DeepSeek以及被誉为“六小虎”的其他团队，已经推出了超过45款基础大模型，平均不到四天就有一款新模型问世。这一速度远超外界预期，显示出行业竞争的激烈程度。

在这场竞赛中，国内大模型公司的第一梯队正逐步逼近海外顶尖阵营的格局。海外以OpenAI、Google、Anthropic、X.AI和meta组成的“五强”为标杆，国内则形成了由阿里、字节、DeepSeek、阶跃星辰和智谱构成的“3+2”组合，被誉为国内的“新基模五强”。

上半年，这五家公司共发布了32个大模型，其中阿里和阶跃星辰尤为突出，分别发布了9款和11款模型，占据了发布总数的半壁江山。这些公司的竞争不仅体现在数量上，更在于模型的质量和创新性。

从行业趋势来看，开源、推理和多模态成为关键词。阿里作为开源的积极倡导者，自2023年起就将旗下多款模型发布在开源社区，成为多个领域的开源SOTA提供者。其混合推理模型Qwen3更是以低成本高性能成为全球最强的开源模型之一。

DeepSeek则以推理大模型著称，其发布的DeepSeek R1在性能和成本上均表现出色，成为后续推理大模型的标杆。该公司专注于推理领域，不做大模型矩阵，以专才身份在竞争中脱颖而出。

多模态大模型则是今年大模型公司的研发重点。阶跃星辰被誉为“多模态卷王”，其发布的多模态模型数量高达16个，其中包括全球范围内参数量最大、性能最好的开源视频生成大模型Step-Video-T2V。字节也在多模态领域表现出色，其文生图模型Seedream 3.0在画质、生成效率以及商业化应用能力上均有显著提升。

尽管大语言模型已经取得了显著进展，但多模态大模型的发展仍然面临挑战。行业内缺少多模态领域的理解生成一体化架构，导致多模态模型的理解和生成仍然由不同的模型完成。然而，这并不意味着多模态领域没有机会，相反，它仍然有可能迎来下一个爆款模型。

在AI应用落地如火如荼的今天，继续押注基础大模型的价值仍然不容忽视。DeepSeek的发布无疑给行业注入了新的活力，证明了模型能力提升带来的技术红利。为了保持竞争力，大厂和创业公司都在积极抢钱、抢人才。

算力、人才和资金是衡量大模型公司实力的三个硬指标。大厂在资金上相对充沛，而创业公司则需要通过融资来支撑前期的研发。智谱和阶跃星辰作为被国资看好的企业，能够在寒冬期持续获得资本青睐，为它们的发展提供了有力保障。

在人才方面，“基模五强”正在展现对人才的虹吸效应。以字节为例，该公司近年来挖走了多位海内外研发骨干，为团队注入了新鲜血液。这些公司在资金和人才的堆积下，逐渐建立了各自的优势。

商业化方面，开源和垂类场景应用成为大模型公司的两个关键方向。开源的中国大模型已经在全球占据了重要地位，在开源社区HuggingFace上，前30的热门模型中有12个来自中国公司。开源之后，大模型公司可以尝试多种商业化手段，如调用API付费、提供GPU服务以及定制化调整和技术服务等。

垂类场景应用方面，智能体（Agent）成为热门方向。智能体在政企、金融、医疗等领域无处不在，与智能终端的结合更是成为关键落地方向。长城汽车CTO吴会肖表示，汽车等高价值软硬件系统与用户密切联系，成为理想的AI载体。同样，手机、具身智能等产品也成为智能体的重要应用场景。

阶跃星辰和智谱等大模型公司纷纷瞄准智能终端赛道，推出了能够在手机端运行的智能体以及Agent在汽车、手机、具身智能、IoT等领域的应用。这些合作不仅提升了智能终端产品的卖点，也为企业带来了可观的收入。