ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

英伟达Blackwell平台适配DeepSeek-V4系列模型 助力开发者高效部署与推理

时间:2026-04-25 21:55:28来源:互联网编辑:快讯

英伟达近日宣布,其NVIDIA Blackwell平台已完成对DeepSeek-V4-Pro与DeepSeek-V4-Flash两款大模型的适配工作。开发者可通过NVIDIA NIM微服务直接下载部署,或基于SGLang、vLLM框架实现定制化推理,为AI应用开发提供更灵活的技术路径。

在模型参数配置上,DeepSeek-V4-Pro以1.6万亿总参数量与490亿激活参数的组合,专注于复杂推理场景;而DeepSeek-V4-Flash则采用2840亿总参数量与130亿激活参数的轻量化设计,主打高速响应需求。两款模型均支持百万级Token上下文窗口与最高38.4万Token的输出能力,可覆盖长文档分析、代码生成等核心应用场景,并采用MIT开源协议保障技术共享。

性能测试显示,DeepSeek-V4-Pro在NVIDIA GB200 NVL72集群上实现每用户每秒150个token的基准性能,通过vLLM框架的Day 0优化方案,可在Blackwell B300架构上快速完成部署。随着Dynamo编译器、NVFP4量化技术及CUDA内核的持续优化,模型推理效率有望进一步提升。

在部署生态构建方面,SGLang框架提供低延迟、均衡负载及最大吞吐量三种优化模式,满足不同场景的性能需求;vLLM框架则支持跨100个以上GPU节点的分布式推理,并集成工具调用与推测解码功能,为大规模AI服务提供技术支撑。这种多框架兼容的设计,显著降低了开发者将模型落地至生产环境的门槛。

更多热门内容
姑苏论道聚焦智能视听:广科院施玉海解读FAST,共探广电行业新未来
另外要注意FAST存在风险:技术风险,存在边缘计算部署成本偏高,技术标准落地、推广难度较大等;市场风险,行业竞争激烈,内容、广告、用户三大核心资源争夺压力较大;数据风险,FAST 业务依托用户画像开展运营,…

2026-06-01

雪浪云AI融合新法:破解复杂装备MDO难题,驱动工业智能升级
近日在无锡举办的第22届中国CAE工程分析技术年会-工业智能与AI大模型仿真应用论坛上,雪浪云分享了一种融合AISkills框架与大模型驱动仿真的方法。 方法针对复杂装备研发中多学科设计优化(MDO)面临的…

2026-06-01

深中通道西人工岛迎新篇:全球首个机器人服务酒店开启智慧文旅新纪元
深圳市文旅产业发展有限公司(简称“深文旅”)与深圳市普渡科技股份有限公司(简称“普渡机器人”)正式达成战略合作,双方将联合打造全球首个实现全流程机器人服务的智慧酒店,为大湾区文旅科创融合注入强劲动能,树立全球…

2026-06-01