在AI领域,一场关于大模型的变革正在悄然进行。自Deepseek R1开源模型年初“横空出世”以来,它迅速成为了众多下游AI应用厂商的首选,甚至有声音认为,大模型的竞争格局已定。然而,事实真是如此吗?
在近日召开的2025世界人工智能大会(WAIC)上,MiniMax的创始人兼CEO闫俊杰给出了不同的看法。他认为,AI领域将会是一个多元共存的格局,多家公司将会共同掌握AI的核心技术。
闫俊杰的观点有着坚实的逻辑基础。他首先指出,由于每个AI模型都需要进行对齐(Model Alignment),而不同模型的对齐目标也会有所不同。例如,有的模型可能以程序员为对齐目标,擅长处理编程任务;有的模型则可能以人际交往为对齐目标,擅长进行流畅的对话;还有的模型可能充满想象力,适合进行创意工作。这种差异使得每个模型都可能带有开发者自己的价值观和思想偏好。
闫俊杰还透露,MiniMax目前使用的AI系统已经不再是单个模型,而是一个多Agent系统。在这个系统中,多个模型可以协同工作,使用不同的工具来解决问题。这种多Agent系统的出现,使得单一模型的优势逐渐减弱,进一步推动了AI领域的多元化发展。
同时,闫俊杰还注意到了开源模型在AI领域的影响力日益增强。近年来,越来越多的开源模型涌现出来,它们的性能也在不断提升,甚至已经逼近了最好的闭源模型。这种趋势使得更多的公司有机会参与到AI领域中来,共同推动AI技术的发展。
以月之暗面推出的Kimi K2基础大模型为例,该模型选择了开源,并在资本市场引发了一波热炒。华西证券评价称,Kimi K2在代码能力和通用Agent任务能力方面表现出色,具备与OpenAI和Anthropic旗下大模型接近的能力。而MiniMax推出的世界上第一个开源的大规模混合架构推理模型MiniMax-M1,也被视为对DeepSeek R1强劲竞争的一种回应。
MiniMax-M1在混合架构的帮助下,在处理长文本任务时具备显著优势。据推算,在生成长度为10万tokens的场景下,MiniMax-M1的计算量仅为DeepSeek R1的25%;在进行8万Token的深度推理时,所需的算力也仅为DeepSeek R1的约30%。这种成本优势使得MiniMax-M1在市场上更具竞争力。
然而,尽管AI技术在不断进步,模型性能在不断提升,但闫俊杰也指出了一些挑战。他观察到,在过去一年半的时间里,尽管业内可使用的算力显著增加,但AI模型的大小并没有发生特别大的变化。他认为,这主要是因为计算速度对于实用模型来说是一个关键因素。如果模型计算速度过慢,就会降低用户的使用意愿。因此,所有公司都在关注模型的参数量和智能水平之间的平衡。
闫俊杰还预测,在未来一两年之内,通过大量的计算网络系统和优化算法,最好模型的推理成本可能还能再降低一个数量级。这将进一步降低AI研发的成本,使得更多的公司有机会参与到AI领域中来。
然而,尽管技术演进优化可能会让AI研发成本降低,但算力使用仍然可能会继续飞速增长。闫俊杰透露,随着AI解决的问题越来越复杂、越来越实用,使用Token的数量也会显著增加。这意味着,尽管单个Token的价格可能会变得便宜,但总体算力需求仍然会保持高速增长。
AI领域的发展仍然充满变数。尽管Deepseek R1等开源模型已经取得了显著的进展,但AI技术的多元化发展趋势仍然不可逆转。多家公司将会共同掌握AI的核心技术,共同推动AI领域的发展。