ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Arm 通过新的 PyTorch 和 ExecuTorch 集成加速从云到边的人工智能,赋能开发者即刻实现性能提升

时间:2024-09-24 09:01:14来源:ITBEAR编辑:茹茹

新闻重点:

· Arm 通过把 Kleidi 技术集成到 PyTorch 和 ExecuTorch,将关键的 AI 性能优势从边侧拓展至云端,赋能新一代应用在 Arm CPU 上运行大语言模型。

· 对普及 ML 工作负载的持续投入将使任一技术栈的开发者能够在最新的生成式 AI 模型上即刻获得显著的推理性能提升。

· 通过扩大与云服务提供商以及主要的 ML 独立软件开发商合作,进一步赋能全球的 AI 开发者。

Arm 控股有限公司(纳斯达克股票代码:ARM,以下简称“Arm”)近期宣布通过将 Arm® Kleidi 技术集成到 PyTorch 和 ExecuTorch,赋能新一代应用在 Arm CPU 上运行大语言模型 (LLM)。Kleidi 汇集了最新的开发者赋能技术和关键资源,旨在推动机器学习(ML) 技术栈中的技术协作和创新。通过这些重要进展,Arm 致力于为任一ML 技术栈的开发者提供更为顺畅的体验。

Arm 战略与生态部开发者技术副总裁 Alex Spinelli 表示:“Arm 正与领先的云服务提供商和框架设计者紧密合作,以打造便捷的开发环境,让软件开发者能够轻松地在基于 Arm 架构的硬件上加速人工智能 (AI) 和 ML 工作负载。自该技术推出的四个月以来,Kleidi 已在 Arm CPU 上加速开发并显著提升主要的 AI 性能。Arm 与 PyTorch 社区的紧密合作印证了该技术可以大大减少开发者利用高效 AI 所需的工作量。”

与领先框架集成,实现显著云端优势

在云端,Kleidi 以利用 Arm Compute Libraries (ACL) 增强 PyTorch 带来的成果为基础,为世界各地在 Arm 平台上优化 AI 的开发者打造蓝图。通过为开发者免去不必要的工程工作,以便开发者能将 Arm 视为运行其关键 ML 工作负载的首选平台。作为实现这一愿景的关键一步,Arm 直接与 PyTorch 和 TensorFlow 进行 Arm Kleidi Libraries 的集成合作,这包括将基本的 Arm 软件库直接集成到上述的领先框架中。

重要的是,这意味着当新的框架版本发布时,应用开发者能够自动从其大幅的性能提升中受益,而无需额外在 Arm 平台上重新编译。这项投入已对合作伙伴关系产生了积极影响:

· Arm 聊天机器人演示 由 meta Llama 3 LLM 驱动,并运行在亚马逊云科技 (AWS) Graviton 处理器上,首次在主线 PyTorch 中实现了实时聊天响应。

o 根据在 AWS Graviton4 上所测得的数据显示,通过将 Kleidi 技术集成到开源 PyTorch 代码库,词元 (token) 首次响应时间可提高 2.5 倍。

· 通过优化 torch.compile 以充分利用通过 ACL 提供的 Kleidi 技术,在基于 AWS Graviton3 上所测得的数据显示,各类 Hugging Face 模型推理工作负载上的性能可提升 1.35 至 2 倍。

这些仅是出色的云端示例之一,却代表了在 Arm 平台上普及 ML 工作负载时可实现的性能加速类型。Arm 将持续投入,以确保开发者的 AI 应用可以在其技术上从云到边都能完美运行,其中包括实现新功能的向前兼容,进而使得开发者能够即刻从中受益。

合作助力开发者紧跟生成式 AI 发展步伐

随着新的语言模型版本快速地推陈出新,生成式 AI 掀起了一波 AI 创新热潮。Arm 持续与 ML 技术栈的各个关键环节紧密合作,携手 AWS 和 Google 等云服务提供商以及 Databricks 等迅速壮大的 ML 独立软件开发商 (ISV) 社区,进而帮助开发者立于技术前沿。

Google Cloud Compute 产品管理高级总监 Nirav Mehta 表示:“Arm 和 Google Cloud 致力于为开发者提升 AI 的可访问性和敏捷性,而 Kleidi 代表了通过软硬件协同优化满足 AI 需求所取得的重要进展。随着我们的客户正积极采用基于 Arm 架构的定制 CPU —— Axion,我们期待在整个 ML 技术栈中为客户带来更加顺畅的集成体验。”

Databricks 软件工程师Lin Yuan 表示:“利用 Databricks Data Intelligence Platform 进行 AI 和 ML 工作流的企业,将受益于跨 ML 软件栈的 Arm Kleidi 集成所带来的性能优化。借助由 Databricks ML Runtime 集群提供支持的 Arm 架构 AWS Graviton处理器,企业可以从各种 ML 软件库的加速中受益,同时降低云服务提供商的成本。”

协助开发者将 Arm 提供的资源应用到实际用例中至关重要,为此 Arm 创建示例软件栈和学习资源,向开发者展示如何在 Arm CPU 上构建 AI 工作负载,进而迅速推动了 Arm 系统的广泛采用,并加快了开发者在 Arm 系统上的部署速度。第一个案例 是通过 Kleidi 技术加速聊天机器人的实现,今年晚些时候 ML Ops 和检索增强生成(RAG)也将添加至这些用例,并计划在 2025 年实现更多成果。

持续提升端侧性能

基于 Kleidi 在端侧的发展势头,KleidiAI 还将被集成到 ExecuTorch (PyTorch 新的端侧推理运行时)。这项集成预计将于 2024 年 10 月完成,并有望为目前正在 ExecuTorch 中进行生产测试或实现的端侧应用带来显著的性能提升。目前已完成的多项 KleidiAI 集成包括与 Google XNNPACK 和 MediaPipe ,以及腾讯的混元大模型,为其实际工作负载带来了显著提升。

Kleidi 将继续与 PyTorch 和 ExecuTorch 的各版本以及其他主要 AI 框架进行集成。从云数据中心到端侧设备,开发者现在可以即刻在各类设备上基于 Arm 平台高效运行高性能 AI 工作负载。Arm 将继续积极地面向 PyTorch 社区推出增强功能,并专注于针对各种整数格式提供量化优化,进一步提高性能,赋能 Arm CPU 大规模无缝运行新一代 AI 体验。

实现更多成果以赋能开发者

PyTorch 正在推动 ML 开发领域的开拓创新。近日,Arm加入 PyTorch 基金会成为 Premier 成员 ,这对于 Arm 的 AI 之旅来说,无疑是一个重要时刻。Arm 将持续致力于赋能全球各地的开发者在 Arm 平台上充分发挥端到端 AI 的潜力,进而塑造前沿的 AI 和应用功能。

###

附加资源:

关于 Kleidi:

Kleidi(古希腊语中意为“钥匙”)基于三大关键支柱而构建:

· 开放的 Arm 技术直接集成至关键框架中,开发者无需任何额外工作,便能使 LLM 无缝取得 Arm CPU 性能。Arm 将确保新技术始终向前兼容,以便开发者可以立即从中受益。

· 通过提供使用指南、学习资源和技术演示等各种资源赋能开发者。

· 借助由 ML 软件供应商、框架和开源项目所构成的活力十足的生态系统,从中取得各类最新的 AI 功能,让 Arm 平台成为开发者构建解决方案的首选平台。

更多热门内容
2025最强折叠手机是哪一款?这款轻薄旗舰遥遥领先
如果说2024年是折叠屏技术的成熟年,那2025就是折叠屏旗舰全面比拼“硬实力”的时代。而在众多新品中,哪一款才配得上“2025最强折叠手机”的称号?答案已经非常明确:荣耀Magic V5凭借全球最薄的机身设计、超大电池续航以及全面均衡的性能表现,稳居行业之巅。2025最强

2025-07-21

三伏克星,智慧恒护!A.O.史密斯“数字真五恒系统”打造清凉无敏堡垒
告别闷热黏腻,远离空调病!三伏天的热浪滚滚而来,高温高湿不仅让人汗流浃背、心烦气躁,更易诱发空调病,甚至加重尘螨、霉菌滋生带来的过敏困扰。紧闭门窗躲清凉?空气沉闷、病菌滋生反而更伤身。如何在酷暑中,为家人筑起一道清凉、洁净、恒久舒适的暑期防线?A.O.史密

2025-07-21

维谛Vertiv收购定制化机柜解决方案制造商
维谛宣布收购定制化机柜解决方案制造商,此次收购将巩固维谛在高密一体化基础设施解决方案的领导地位。作为全球领先的关键数字基础设施及连续性解决方案提供商,维谛(Vertiv,NYSE:VRT)于2025年7月17日宣布,其已达成协议以2亿美元收购Great Lakes Data RacksCabinets

2025-07-21

迎14周年,春雨医生开启“线上直播感恩月”
2025年7月19日,中国移动互联网医疗的开创者春雨医生,迎来了14周岁的生日。14岁的春雨医生,已近成年。巧合的是:春雨医生在诞生之初,恰好迎来了移动互联网时代的发展,并乘势开创了在线问诊、空中诊所、开放平台等如今移动医疗行业的“标配”服务;而14年后的今年,随

2025-07-21

福昕软件"数智枫桥·数治北京"解决方案获评全国智慧检务创新案例
近日,由法制日报社主办的2025政法智能化建设案例及论文征集宣传活动评选结果揭晓。本次共评出智慧治理、智慧法院、智慧检务、智慧警务、智慧司法典型案例各10个、创新案例各20个、创新论文各30篇。福昕软件联合北京市人民检察院研发的“数智枫桥·数治北京”解决方案,

2025-07-21

从700万到800万台仅2个月,九号智能两轮电动车为何能领跑行业?
九号公司最近真的是喜事连连,最近九号公司生产的第800万台九号电动两轮车正式发车,而距离700万台发车仅仅过去了2个月的时间,毫无疑问九号电动车的增长势能领跑整个行业。在此期间,九号公司也正参展第三届链博会,并在“数字科技链条”展区展出多款重磅新品及核心零

2025-07-21

强势通过欧盟能效测试 三星Galaxy Z Flip7|Z Flip7 FE耐用性太出色
随着智能手机市场趋于饱和,消费者的换机周期越来越长。在TechInsights发布的调研报告显示,消费者的换机周期已经从此前的18个月增至51个月。因此,消费者在选择机型时,更加注重其使用寿命。近日,据外媒报道,三星全新推出的Galaxy Z Flip7和Galaxy Z Flip7 FE在续航

2025-07-21

TCL科技以绿色产业链筑牢化学品安全防线,强化绿色制造与合规运营
化学品安全是工业生产中保障人类健康、生态环境与产业可持续发展的重要环节。为确保生产运营合规稳定,TCL科技旗下生产型子公司设立专责部门,负责化学品全流程风险识别与管控,严格执行有害物质管理要求,确保产品在生产、运输、使用、处置等各环节中的安全性。全流程

2025-07-21

扬帆起航,争做行业“小龙” ——2025“直通乌镇”全球互联网大赛火热报名中
自2014年世界互联网大会乌镇峰会启幕以来,这一国际盛会已走入新的十年。“直通乌镇”全球互联网大赛作为乌镇峰会的亮点活动,历经六年深耕,已成为全球互联网领域的重要赛事之一。2025“直通乌镇”全球互联网大赛已全面开放报名,诚邀全球互联网领域项目踊跃参赛,在全

2025-07-21

从尖端技术到无障碍关怀:vivo携多项创新成果亮相联通合作伙伴大会
2025年7月18日,中国联通合作伙伴大会于上海盛大启幕,本次大会以“向实同行 共融新生态”为主题,汇聚全球伙伴共谋智能时代新机遇。vivo作为中国联通核心战略合作伙伴及创新领军企业,以“智领未来,共融新生态”为主题,全面展示其在6G技术、AI个人化智能、无障碍科技

2025-07-21