ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达推出Nemotron 3 Super:开源大模型助力多智能体系统高效运行

时间:2026-03-12 09:06:33来源:互联网编辑:快讯

英伟达公司正式推出其迄今为止性能最强的开源权重AI模型——Nemotron 3 Super。这款专为复杂智能体系统设计的模型拥有1200亿参数,采用混合专家架构,在推理时仅激活120亿参数,既保证了计算效率又降低了资源消耗。与完全闭源的GPT-4等模型不同,该模型将核心参数完全开放,允许开发者自由下载、运行及微调。

行业应用方面,Perplexity、Palantir和西门子等科技巨头已率先将其引入核心业务场景。在搜索优化、软件开发、电信网络设计及半导体制造等领域,该模型展现出强大的任务处理能力,尤其擅长支撑自主智能体完成高精度复杂任务。其百万Token的超大上下文窗口设计,有效解决了多智能体交互中常见的"上下文爆炸"问题,使工作流状态保持完整,显著降低多步推理成本。

技术架构实现多重突破。混合专家架构使模型吞吐量提升5倍,准确率较前代产品翻倍。创新性的Mamba层结构将内存与计算效率提高4倍,配合Transformer层的高级推理能力,形成高效协同。通过"潜在MoE"技术,模型能以单个专家的计算成本激活四个专家,配合多token预测功能使推理速度提升3倍。在英伟达Blackwell平台上采用NVFP4精度运行时,内存需求较Hopper架构的FP8降低75%,推理速度提升4倍。

开源策略体现高度开放性。除公开模型权重外,英伟达同步发布了完整的训练方法,包括超10万亿token的数据集构成和评估方案。该模型支持直接加载完整代码库进行端到端调试,也能瞬间处理数千页规模的财务报告等长文本。开发者可通过Hugging Face平台或谷歌云、甲骨文等云服务商获取模型,AWS和Azure版本即将上线。

部署方案兼顾灵活性与便捷性。模型已封装为NVIDIA NIM微服务,支持在本地数据中心和云端环境无缝部署。这种设计既满足企业级应用对数据安全的要求,又为中小开发者提供了低成本接入途径。混合专家架构的动态参数激活机制,使企业可根据实际需求灵活调整计算资源投入。

更多热门内容
2026旗舰手机大比拼:商务影像全能之选与游戏性能巅峰对决
对于追求性能的游戏爱好者,以下几款手机在2026年同样表现出色,它们都搭载了的第五代骁龙8至尊版移动平台,但在散热、屏幕和专属优化上各有侧重。它的哈苏全大底五摄系统带来了无与伦比的影像体验,7050mAh超…

2026-06-09

OPPO Find X9s Pro:AI赋能学习生活,全能旗舰助力学生多元需求
在ColorOS 16“超流畅,更AI”的系统理念下,它集成了大量针对学习和生活场景深度优化的AI功能,使其成为一款能够无缝融入学生日常学习、社交、娱乐和探索生活的全能伙伴。在6000元以内的价位段,OPPO…

2026-06-09