ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达Nemotron 3 Super开源大模型亮相:1200亿参数助力智能体系统升级

时间:2026-03-12 08:14:36来源:互联网编辑:快讯

英伟达近日正式推出其史上最强大的开源权重AI模型——Nemotron 3 Super,这一举措为人工智能领域注入新的活力。开源权重模型的核心在于将决定模型行为的关键参数向公众开放,开发者可自由下载并在本地设备上运行或优化,与GPT-4等闭源模型形成鲜明对比。

该模型拥有1200亿参数,采用混合专家(MoE)架构设计,推理时仅激活120亿参数,在保证性能的同时显著降低计算成本。其专为大规模复杂智能体系统打造,结合先进的推理能力,可支持自主智能体高精度完成任务。目前,Perplexity、Palantir和西门子等科技巨头已将其应用于搜索、软件开发、电信及半导体设计等核心业务场景。

随着企业AI应用从单一聊天机器人向多智能体协作转型,行业面临两大挑战:多智能体交互产生的Token量激增导致成本飙升,以及复杂推理流程引发的系统迟缓。数据显示,多智能体交互可能使Token量增加15倍,同时每步推理需求进一步推高计算开销。Nemotron 3 Super通过配备100万Token的超大上下文窗口,使智能体能够完整保留工作流状态,有效避免目标偏移,并大幅降低多步推理成本。

在技术架构层面,该模型通过混合专家架构将吞吐量提升至前代的5倍,准确率实现翻倍增长。其创新性的Mamba层设计使内存和计算效率提高4倍,而Transformer层则专注于高级推理任务。更引人注目的是"潜在MoE"技术,该技术允许以单个专家的计算成本激活四个专家,配合多Token预测功能,使推理速度提升3倍。在英伟达Blackwell平台上,该模型采用NVFP4精度运行,相较Hopper架构的FP8,内存需求降低的同时推理速度提升4倍。

英伟达对模型开放策略采取前所未有的力度,不仅通过宽松许可证开源模型权重,更公开完整训练方法,包括超10万亿Token的数据集构建方案和评估指标。这种透明度使开发者能够直接加载完整代码库进行端到端调试,或快速处理数千页财务报告等超长文本。实际应用中,某金融企业利用该模型在30秒内完成对2000页年报的深度分析,效率较传统方法提升20倍。

开发者可通过Hugging Face平台及谷歌云、甲骨文等云服务商获取模型,AWS和Azure服务即将上线。为简化部署流程,英伟达将其封装为NVIDIA NIM微服务,支持在本地数据中心和云端无缝迁移。某软件开发团队测试显示,基于该微服务的智能体协作系统,在代码生成任务中较前代模型减少67%的推理时间,同时保持92%的准确率。

更多热门内容
谷歌与默沙东达成10亿美元合作 智能体技术深度赋能制药全链条
当地时间4月22日,默沙东宣布与谷歌正式达成价值高达10亿美元、计划持续多年的合作,谷歌将在默沙东的研发、制造、商业和职能方面均部署智能体平台。此次谷歌将直接嵌入默沙东全公司的系统性建设。搜狐AI健康将持续…

2026-04-26

谷歌与默沙东10亿美元合作:AI智能体深度融入制药全产业链新探索
当地时间4月22日,默沙东宣布与谷歌正式达成价值高达10亿美元、计划持续多年的合作,谷歌将在默沙东的研发、制造、商业和职能方面均部署智能体平台。此次谷歌将直接嵌入默沙东全公司的系统性建设。搜狐AI健康将持续…

2026-04-26

自变量获四家大厂投资,机器人进家庭倒计时,具身智能迎新突破
据《消费者报道》了解,在去年年底,自变量与招商积余医养公司(招商观颐)、深圳技术大学联合申报的“面向生活照料的智能机器人研发与应用验证”项目,入选工业和信息化部、民政部联合发布的《智能养老服务机器人结对攻关…

2026-04-26