英伟达推出Nemotron 3 Super：开源大模型助力多智能体系统高效运行-业界动态-ITBear科技资讯

英伟达公司正式推出其迄今为止性能最强的开源权重AI模型——Nemotron 3 Super。这款专为复杂智能体系统设计的模型拥有1200亿参数，采用混合专家架构，在推理时仅激活120亿参数，既保证了计算效率又降低了资源消耗。与完全闭源的GPT-4等模型不同，该模型将核心参数完全开放，允许开发者自由下载、运行及微调。

行业应用方面，Perplexity、Palantir和西门子等科技巨头已率先将其引入核心业务场景。在搜索优化、软件开发、电信网络设计及半导体制造等领域，该模型展现出强大的任务处理能力，尤其擅长支撑自主智能体完成高精度复杂任务。其百万Token的超大上下文窗口设计，有效解决了多智能体交互中常见的"上下文爆炸"问题，使工作流状态保持完整，显著降低多步推理成本。

技术架构实现多重突破。混合专家架构使模型吞吐量提升5倍，准确率较前代产品翻倍。创新性的Mamba层结构将内存与计算效率提高4倍，配合Transformer层的高级推理能力，形成高效协同。通过"潜在MoE"技术，模型能以单个专家的计算成本激活四个专家，配合多token预测功能使推理速度提升3倍。在英伟达Blackwell平台上采用NVFP4精度运行时，内存需求较Hopper架构的FP8降低75%，推理速度提升4倍。

开源策略体现高度开放性。除公开模型权重外，英伟达同步发布了完整的训练方法，包括超10万亿token的数据集构成和评估方案。该模型支持直接加载完整代码库进行端到端调试，也能瞬间处理数千页规模的财务报告等长文本。开发者可通过Hugging Face平台或谷歌云、甲骨文等云服务商获取模型，AWS和Azure版本即将上线。

部署方案兼顾灵活性与便捷性。模型已封装为NVIDIA NIM微服务，支持在本地数据中心和云端环境无缝部署。这种设计既满足企业级应用对数据安全的要求，又为中小开发者提供了低成本接入途径。混合专家架构的动态参数激活机制，使企业可根据实际需求灵活调整计算资源投入。