英伟达发布Nemotron Nano v2小模型，性能媲美Qwen3，速度提升6倍-信息流-ITBear科技资讯

在人工智能领域，小型模型的竞争正逐渐升温。继麻省理工学院衍生公司Liquid AI推出可装载于智能手表上的新型AI视觉模型，以及谷歌发布适用于智能手机的小型模型后，英伟达也紧随其后，发布了自己的小型语言模型——Nemotron Nano v2。

这款仅有90亿参数的“小”模型，在复杂推理基准测试上的表现令人瞩目，其准确率与Qwen3-8B相当，甚至在某些情况下更高，同时处理速度却快了6倍。这一突破性的表现，无疑为小型模型的发展注入了新的活力。

英伟达此前在论文中就曾提出，小型模型才是智能体的未来。此次Nemotron Nano v2的发布，无疑是对这一观点的有力支撑。英伟达不仅推出了这款模型，还首次开源了用于创建它的绝大部分数据，包括预训练语料库，这一举措无疑将推动人工智能领域的进一步发展。

据悉，Nemotron Nano v2在20万亿多个token上进行了预训练，这一庞大的数据量确保了模型的准确性和泛化能力。与Qwen相比，其在速度上的提升尤为显著，这得益于英伟达在模型优化方面的深厚积累。

Nemotron Nano v2还具备独特的“思考预算控制”功能。用户可以根据需要，指定模型在推理过程中被允许的“思考”token数量。这一功能使得模型在处理复杂任务时，能够更加高效地利用计算资源，同时保证答案的质量。

在评估结果中，Nemotron Nano v2展现出了强大的性能。在多个基准测试上，其准确率均优于其他开源小规模模型。例如，在NeMo-Skills套件的“推理开启”模式下，该模型在AIME25上达到了72.1%，在MATH500上达到了97.8%，在GPQA上达到了64.0%，在LiveCodeBench上达到了71.1%。这些成绩充分证明了Nemotron Nano v2在复杂推理和非推理任务上的出色表现。

除了模型本身的性能，英伟达还注重模型的实用性和易用性。Nemotron Nano v2支持在线试用，用户可以通过简单的配置，即可体验这款强大的小型语言模型。英伟达还发布了两个基础模型，分别对应模型训练的不同阶段，为用户提供了更多的选择和灵活性。

在数据方面，英伟达首次公开了他们用于创建Nemotron Nano v2的绝大部分数据。这些数据包括66万亿个优质网络爬取数据、数学数据、代码数据、SFT数据和多语言问答数据等。这些数据经过精心处理和筛选，确保了模型的准确性和可靠性。同时，英伟达也表示，他们将继续致力于开源和共享数据，以推动人工智能领域的进一步发展。

英伟达此次发布的Nemotron Nano v2，无疑为小型模型的发展树立了新的标杆。其出色的性能、独特的功能和实用的特性，使得这款模型在人工智能领域具有广泛的应用前景。随着小型模型的竞争日益激烈，我们期待未来能够看到更多像Nemotron Nano v2这样的优秀模型涌现。