ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达发布Nemotron Nano v2小模型,性能媲美Qwen3,速度提升6倍

时间:2025-08-20 02:31:05来源:量子位编辑:快讯团队

在人工智能领域,小型模型的竞争正逐渐升温。继麻省理工学院衍生公司Liquid AI推出可装载于智能手表上的新型AI视觉模型,以及谷歌发布适用于智能手机的小型模型后,英伟达也紧随其后,发布了自己的小型语言模型——Nemotron Nano v2。

这款仅有90亿参数的“小”模型,在复杂推理基准测试上的表现令人瞩目,其准确率与Qwen3-8B相当,甚至在某些情况下更高,同时处理速度却快了6倍。这一突破性的表现,无疑为小型模型的发展注入了新的活力。

英伟达此前在论文中就曾提出,小型模型才是智能体的未来。此次Nemotron Nano v2的发布,无疑是对这一观点的有力支撑。英伟达不仅推出了这款模型,还首次开源了用于创建它的绝大部分数据,包括预训练语料库,这一举措无疑将推动人工智能领域的进一步发展。

据悉,Nemotron Nano v2在20万亿多个token上进行了预训练,这一庞大的数据量确保了模型的准确性和泛化能力。与Qwen相比,其在速度上的提升尤为显著,这得益于英伟达在模型优化方面的深厚积累。

Nemotron Nano v2还具备独特的“思考预算控制”功能。用户可以根据需要,指定模型在推理过程中被允许的“思考”token数量。这一功能使得模型在处理复杂任务时,能够更加高效地利用计算资源,同时保证答案的质量。

在评估结果中,Nemotron Nano v2展现出了强大的性能。在多个基准测试上,其准确率均优于其他开源小规模模型。例如,在NeMo-Skills套件的“推理开启”模式下,该模型在AIME25上达到了72.1%,在MATH500上达到了97.8%,在GPQA上达到了64.0%,在LiveCodeBench上达到了71.1%。这些成绩充分证明了Nemotron Nano v2在复杂推理和非推理任务上的出色表现。

除了模型本身的性能,英伟达还注重模型的实用性和易用性。Nemotron Nano v2支持在线试用,用户可以通过简单的配置,即可体验这款强大的小型语言模型。英伟达还发布了两个基础模型,分别对应模型训练的不同阶段,为用户提供了更多的选择和灵活性。

在数据方面,英伟达首次公开了他们用于创建Nemotron Nano v2的绝大部分数据。这些数据包括66万亿个优质网络爬取数据、数学数据、代码数据、SFT数据和多语言问答数据等。这些数据经过精心处理和筛选,确保了模型的准确性和可靠性。同时,英伟达也表示,他们将继续致力于开源和共享数据,以推动人工智能领域的进一步发展。

英伟达此次发布的Nemotron Nano v2,无疑为小型模型的发展树立了新的标杆。其出色的性能、独特的功能和实用的特性,使得这款模型在人工智能领域具有广泛的应用前景。随着小型模型的竞争日益激烈,我们期待未来能够看到更多像Nemotron Nano v2这样的优秀模型涌现。

更多热门内容