ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

加速国产大模型:AMD推出vLLM-ATOM插件大幅提升推理效率

时间:2026-05-13 05:51:24来源:CHINAZ编辑:快讯

AMD近日正式发布了专为大语言模型部署设计的vLLM-ATOM插件。该插件旨在不改变现有工作流的前提下,显著优化DeepSeek-R1、Kimi-K2 等主流国产大模型在AMD硬件上的推理性能。

作为面向高并发场景的开源推理框架,vLLM一直以显存利用率高而著称。此次AMD推出的插件提供了更贴合其Instinct系列GPU的优化方案,确保开发者能以极低的学习成本实现技术迁移。

实现性能平滑升级

vLLM-ATOM插件的核心优势在于“零成本”部署,用户无需改动原有的API或端到端工作流。插件会在后台自动接管并优化请求调度与内核调优,使得现有服务能平滑迁移至AMD硬件后端。

从架构设计上看,该插件分为三层:顶层负责兼容OpenAI接口,中间层负责模型实现与路由,底层则提供核心GPU内核。这种结构有效集成了混合专家模型(MoE)及量化技术,为大规模部署提供了保障。

广泛适配算力生态

该插件重点面向AMD旗下的Instinct MI350 及MI400 系列高性能GPU。它不仅支持Qwen3、GLM等主流中文大语言模型,还全面覆盖了稠密模型、混合专家模型以及视觉语言模型(VLM)等多种应用场景。

随着vLLM-ATOM的推出,AMD进一步降低了企业级AI部署的门槛。通过对DeepSeek-R1 等顶尖模型的深度优化,这一工具将帮助更多开发者利用AMD算力资源,实现更高效、更稳定的在线AI服务转化。

更多热门内容
华为前AI算法专家创业新篇:以认知科学赋能世界模型,斩获亿元级融资
而是优先沉淀具身技能学习、认知地图移动导航、一脑多机协同等可复用模块,在真实场景中形成数据与现金流闭环,再反哺核心研发。 对具脑磐石来说,此轮融资之后最重要的答卷,就是让认知世界模型在真实机器人任务中跑起来…

2026-05-26

AIROBO引领新趋势:中国机器人产业迈向运营时代,布局未来社区新蓝海
正如移动互联网时代真正拥有长期价值的,并不是单一手机制造商,而是掌握系统生态、流量入口与用户网络的平台型企业,未来机器人时代最具战略价值的企业,也可能不是制造机器人最多的公司,而是掌握机器人运营入口与数据网络…

2026-05-26

《人工智能应用伦理安全指引1.0》发布 助力AI向善规范发展
5月19日,在2026年中国网络文明大会人工智能赋能网络文明建设分论坛上,全国网络安全标准化技术委员会(以下简称“网安标委”)发布了《人工智能应用伦理安全指引1.0》(以下简称《指引》)。 为进一步引导人工智…

2026-05-26

AIROBO引领变革:机器人行业告别“卖设备”,开启“运营网络”新纪元
业内分析认为,机器人行业未来最大的公司,很可能不是单纯制造机器人的企业,而是掌握机器人运营网络、数据入口与AI模型的平台型公司。AIROBO 正在联合物业、商业及城市合作伙伴,共同建设本地化机器人地图数据库…

2026-05-26

30余位优质网络主播齐聚天津 探展智博会解锁“工业机器人天团”魅力
本次活动为期四天,主播团将走进智博会实地探展,近距离感受天津“工业机器人天团”——一批“能跑、能飞、能协同”的智能机器人将成为镜头下的主角,全方位展现科创天津的硬核实力。5月26日起,一场主播与城市的双向奔…

2026-05-26

AI融入消费新图景:从场景革新到需求激活 开启智能生活新篇章
在这里,AI技术贯穿餐饮全流程,从后厨烹饪到前台服务,再到氛围营造,构建起一条完整的“机器人服务链”,让餐饮服务更高效标准,为食客带来全新的消费体验。 从场景革新到体验升级,从供给优化到需求激活……随着技术的…

2026-05-26

科技活动周顺德主场启幕 青少年科创赛事与科普活动共筑创新未来
该工程贯穿全年,通过“以赛为媒、以赛促学”,构建起涵盖机器人大赛、青少年科技创新大赛、无人机大赛、魔方科技挑战赛及纸飞机大赛等多元化的科创赛事体系,开展科普研学“探秘顺德智造”“流动科学馆”进学校社区等,旨在…

2026-05-26