英伟达Nemotron 3 Super开源大模型亮相：1200亿参数助力智能体系统升级-业界动态-ITBear比尔科技

英伟达近日正式推出其史上最强大的开源权重AI模型——Nemotron 3 Super，这一举措为人工智能领域注入新的活力。开源权重模型的核心在于将决定模型行为的关键参数向公众开放，开发者可自由下载并在本地设备上运行或优化，与GPT-4等闭源模型形成鲜明对比。

该模型拥有1200亿参数，采用混合专家（MoE）架构设计，推理时仅激活120亿参数，在保证性能的同时显著降低计算成本。其专为大规模复杂智能体系统打造，结合先进的推理能力，可支持自主智能体高精度完成任务。目前，Perplexity、Palantir和西门子等科技巨头已将其应用于搜索、软件开发、电信及半导体设计等核心业务场景。

随着企业AI应用从单一聊天机器人向多智能体协作转型，行业面临两大挑战：多智能体交互产生的Token量激增导致成本飙升，以及复杂推理流程引发的系统迟缓。数据显示，多智能体交互可能使Token量增加15倍，同时每步推理需求进一步推高计算开销。Nemotron 3 Super通过配备100万Token的超大上下文窗口，使智能体能够完整保留工作流状态，有效避免目标偏移，并大幅降低多步推理成本。

在技术架构层面，该模型通过混合专家架构将吞吐量提升至前代的5倍，准确率实现翻倍增长。其创新性的Mamba层设计使内存和计算效率提高4倍，而Transformer层则专注于高级推理任务。更引人注目的是"潜在MoE"技术，该技术允许以单个专家的计算成本激活四个专家，配合多Token预测功能，使推理速度提升3倍。在英伟达Blackwell平台上，该模型采用NVFP4精度运行，相较Hopper架构的FP8，内存需求降低的同时推理速度提升4倍。

英伟达对模型开放策略采取前所未有的力度，不仅通过宽松许可证开源模型权重，更公开完整训练方法，包括超10万亿Token的数据集构建方案和评估指标。这种透明度使开发者能够直接加载完整代码库进行端到端调试，或快速处理数千页财务报告等超长文本。实际应用中，某金融企业利用该模型在30秒内完成对2000页年报的深度分析，效率较传统方法提升20倍。

开发者可通过Hugging Face平台及谷歌云、甲骨文等云服务商获取模型，AWS和Azure服务即将上线。为简化部署流程，英伟达将其封装为NVIDIA NIM微服务，支持在本地数据中心和云端无缝迁移。某软件开发团队测试显示，基于该微服务的智能体协作系统，在代码生成任务中较前代模型减少67%的推理时间，同时保持92%的准确率。

元戎启行发布物理AI新进展阮翀首亮相自动驾驶量产目标再升级

2026-04-26

AI人才争夺新动向：OpenAI广纳贤才，传统软件业面临双重挑战

2026-04-26

谷歌与默沙东达成10亿美元合作智能体技术深度赋能制药全链条

当地时间4月22日，默沙东宣布与谷歌正式达成价值高达10亿美元、计划持续多年的合作，谷歌将在默沙东的研发、制造、商业和职能方面均部署智能体平台。此次谷歌将直接嵌入默沙东全公司的系统性建设。搜狐AI健康将持续…

2026-04-26

谷歌与默沙东10亿美元合作：AI智能体深度融入制药全产业链新探索

2026-04-26

元戎启行发布物理AI技术路线首席科学家阮翀首次公开演讲

2026-04-26

杨戬“放水”解读爆火：信息过载时代，流量如何被情绪精准“点燃”？

2026-04-26

自变量获四家大厂投资，机器人进家庭倒计时，具身智能迎新突破

据《消费者报道》了解，在去年年底，自变量与招商积余医养公司（招商观颐）、深圳技术大学联合申报的“面向生活照料的智能机器人研发与应用验证”项目，入选工业和信息化部、民政部联合发布的《智能养老服务机器人结对攻关…

2026-04-26