ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Intel开源NPU加速库,酷睿Ultra处理器AI PC可运行轻量级大语言模型

时间:2024-03-04 11:24:05来源:ITBEAR编辑:快讯

【ITBEAR科技资讯】3月4日消息,近日,Intel在GitHub上公开了其NPU加速库,这一举措使得装备了酷睿Ultra处理器的AI PC得以流畅运行诸如TinyLlama、Gemma-2b等轻量级大型语言模型。

酷睿Ultra系列首次集成了NPU AI引擎,该引擎能够处理一些轻量级的AI推理任务,并与CPU、GPU协同工作,以应对各类AI应用的需求。

据ITBEAR科技资讯了解,虽然这次开源的NPU加速库主要针对开发人员,但拥有一定编程经验的用户同样可以尝试使用。Intel的软件架构师Tony Mongkolsmai展示了如何利用此开源库,在微星尊爵14 AI Evo笔记本电脑上运行一个基于11亿参数的TinyLlama大模型的AI聊天机器人,该机器人能进行简单的对话。同时,Windows任务管理器也证实了NPU的有效调用。

然而,当前的开源NPU加速库在功能上还存在一些不足,它支持8比特量化和FP16精度,但尚不支持4比特量化、BF16精度以及NPU/GPU的混合计算等高级功能,且相关技术文档也尚未提供。不过,Intel已承诺将在后续逐步扩展其功能,预期将比现有功能增加一倍,这无疑将为AI开发者们带来更多的便利和可能性。

更多热门内容
2026武汉无人机巡检展:以智能科技赋能,开启输电线路安全运维新篇章
本届展会将集中展示针对输电线路定制化的无人机巡检技术,实现从"人工巡视"到"智能感知"的跨越:利用倾斜摄影与激光点云技术,无人机可快速构建输电线路高精度三维模型,实现线路走廊的数字孪生。 南方电网云南公司…

2026-05-25