ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

夯实算力根基 共筑产业生态:Arm让AI惠及每一个人

时间:2024-06-18 14:41:50来源:互联网编辑:茹茹

近两年,AI技术的热潮不仅惠及了千行百业,也颠覆了人们的生活。从云端百亿、千亿参数的大模型,到边缘、终端的“小模型”,像vivo的蓝心大模型BlueLM,可以在设备端提供写作、绘画等AIGC的能力,极大改善了用户的使用体验。这种潮流正在形成一种趋势,生成式AI为手机、电脑、智能穿戴、家电等终端带来了真正的智能进化,Arm则是这一切的基石。

“Arm为最大的计算生态系统提供了普适应用,以及对开发者友好的指令集,不断满足下一波的计算性能需求。”Arm终端事业部产品管理副总裁James McNiven表示,“这意味着在设备端和云端都会有更高的性能,同时在某些情况下会需要更高的能耗驱动AI技术,而能效正是Arm的DNA。Arm架构的强大实力可以为计算平台带来最高效的性能。”

Arm终端事业部产品管理副总裁James McNiven前不久,Arm推出了Arm终端计算子系统(CSS),为旗舰系统级芯片提供基础计算要素,包括全新的Armv9.2 CPU、Arm Immortalis GPU、基于3纳米工艺生产就绪的CPU和GPU物理实现,以及最新的CoreLink系统互连和系统内存管理单元(SMMU)。此外,Arm还通过新推出的Arm Kleidi软件库帮助软件开发者无缝获得Arm CPU的最佳性能。通常,Arm的大多数IP会通过RTL的形式交付,要使RTL变为芯片还要借助EDA工具流,通过一系列的优化和工具完成工具流后提供物理实现。此次Arm除了提供RTL形式的IP交付,还会额外为合作伙伴提供CPU和GPU的物理实现选项。

过去几年中,专为性能和AI设计的Armv9架构在矢量加速、机器学习、安全性、稳定性等方面有着显著提升,在Armv9.2的基础上,Arm通过新一代Arm Cortex-X CPU和Immortalis GPU带来了更高的性能,并以效率为核心,融入了Arm终端CSS的全新能力,加速产品上市进程。Arm终端CSS可让IPC性能同比提高36%,AI推理速度提高59%,ArmImmortalis GPU图形性能提高37%。Arm深知,CPU、GPU、NPU等异构计算的重要性,不同加速器之间的协同可以满足各类应用场景,为客户带来更多的选择。例如,Immortalis GPU在持续推进智能手机中的光线追踪技术普及。在可扩展性方面,三种不同的 CPU 微架构让Arm的合作伙伴能够在包括笔记本电脑、智能手机、数字电视和可穿戴设备等一系列设备上提供对应的性能、效率,以及CPU和GPU解决方案。

Arm Cortex-X925实现了Cortex-X系列推出以来最高的同比性能提升,在3.8GHz的时钟速率和最大缓存大小的条件下,与2023年旗舰智能手机的4纳米SoC相比,其单线程性能大幅提高36%,AI性能相较去年的Cortex-XCPU在Token首次响应时间上提高41%,显著增强了LLM等在设备端的响应能力。微架构的演进带来了最宽的解码和矢量设计大幅提升,TOPS数增长50%。通过更好的可配置性和更大的私有L2缓存,可以保留进出过CPU的指令和数据。Arm Immortalis-G925 GPU在多个AI和ML网络上提升了34%的性能,并把光线追踪技术在面对复杂物体时的表现,在性能上提升了52%。

效率方面,Arm会选择不同的CPU微架构实现最大性能和最长使用天数,通过Immortalis和Arm Mali提供GPU可扩展性,实现性能和效率的灵活性。与Cortex-A720相比,Cortex-A725的能效提高了35%。Cortex-A520 CPU也随着工艺和物理实现的提升得到了改进。图形效率方面,在与去年的终端平台相同水平的游戏性能下,《堡垒之夜》等手游的功耗降低了30%。在为Cortex-X925带来的30%性能提升的基础上,Arm对网页浏览器也进行了改进,使其性能提高23%。

Arm继续携手Google,推动了安卓动态性能框架(Android Dynamic Performance framework)的发展。在最新版本的框架中,高端内容的每帧能耗降低25%,帧速率提高35%。此外,Arm还调整了安卓工作负载在不同CPU核心之间的平衡方式,为YouTube节省了10%的功耗。针对Google的AV1视频编解码器,Arm进行了软件优化,使当下安卓设备的视频性能最多可提高40%。

除此之外,Arm的内存标记扩展(Memory Tagging Extension, MTE)可以帮助开发者在无需侵入式检测的情况下查找和修复代码中的错误,还可以在实际操作环境下,用来减少安全漏洞被利用。目前,vivo X100、vivo X100 Pro、Google Pixel 8等旗舰设备均允许用户启用MTE。

James McNiven称:“对于Arm终端CSS的完整解决方案来说,我们会针对不同用例,或是某些测试基准设定目标,将其分解到单个IP中。以游戏《原神》为例,我们先从系统层面进行分析,然后针对GPU、CPU等设定提升的目标,将各类游戏机制和计算能力推向极限,每个单一IP的性能提升都会为终端CSS的整体性能添砖加瓦。”

为了帮助开发者更好地发挥Arm终端CSS的性能优势,Arm还推出了Arm Kleidi,包括面向AI工作负载的KleidiAI和面向计算机视觉应用的KleidiCV。KleidiAI是一套面向AI框架开发者的计算内核,使他们能够在各种设备上轻松获得Arm CPU上的最佳性能,并支持Neon、SVE2和SME2等关键Arm架构功能,显著提升计算应用的性能。KleidiAI与PyTorch、Tensorflow、MediaPipe等热门AI框架集成,旨在加速meta Llama 3、Phi-3等关键模型的性能,并且可以前后兼容,确保Arm在引入更多技术时依然能适用未来市场的需求。Kleidi一词源于希腊语,意为“钥匙”,即为开发者释放更多性能的“钥匙”。

KleidiAI支持可伸缩矢量扩展(Scalable Vector Extensions, SVE)、可伸缩矩阵扩展(Scalable Matrix Extensions, SME)等能力,部署在Cortex-X925上时,Kleidi技术运行Llama 3和Phi-3LLM的速度要比参考实现快2.9倍,24小时内即可实现。KleidiCV则可以融入神经网络、传统计算机视觉算法等技术,确保社交媒体、摄像头等应用流畅运行。Arm会与OpenCV.ai合作,帮助安卓开发者更便捷地将OpenCV纳入他们的项目中,并从KleidiCV的改进中受益。

Arm在指令预取、分支预测、大缓存等前端访存能力的持续投入,使得应用程序的性能大幅提升,vivo就是很大的受益者,Arm微架构的升级让vivo手机的流畅度达到非常高的水准。Arm终端CSS将为vivo的生成式AI应用提供了强劲的处理能力,也为开发者带来了广阔的发挥空间。vivo首席芯片规划专家夏晓菲谈到:“Arm作为整个产业链的最上游,我们希望把vivo产品的痛点和需求,对工作负载的分析以及产品性能功耗瓶颈的分析,反馈给Arm,使我们整个产业链能够良性循环起来,从而使我们手机产品最终受益,给消费者带来越来越好的体验。”

Arm终端事业部产品管理副总裁James McNiven(左)&vivo首席芯片规划专家夏晓菲(右)

从AI手机到AI PC,Arm发展势头强劲。Windows on Arm(WoA)的生态愈发成熟,越来越多的Arm架构机型和Arm原生应用持续涌现,除了Microsoft Office、Dropbox、Zoom、Adobe套件等,还有百度、哔哩哔哩、Chrome浏览器、爱奇艺、搜狗、腾讯QQ音乐等带来了丰富的体验,Audacity、Blender和OBS Studio(用于流媒体)等开源工具的增多让开发者有了更大的热情,这些应用还整合了大量的开源库和开发工具,面向Windows的Arm Performance Libraries(Arm性能库)推动着WoA生态不断发展。

可以说,通过与合作伙伴的深度协作,Arm的产品和技术正在全球的每一个角落推进着计算能力挑战极限,让AI技术惠及每一个人。“作为计算的基石,Arm致力于通过新技术的推出,帮助我们的合作伙伴取得成功,我们希望能赋能合作伙伴打造出面向AI应用最卓越的设备、芯片组和SoC,为消费者的下一代AI体验夯实根基。”James McNiven说。

更多热门内容
别再被参数忽悠!高端电视玩法已变,SQD-Mini LED技术成为巅峰画质标准
今年双11,打开某电商平台的高端电视页面,「分区」、「亮度」这种看着不明觉厉的宣传语扑面而来——但身为消费者,真的还是弄不清,怎么拨开这些花里胡哨的参数,真正选到一台体验好,画质高的高端电视?这方面,要我说,还是得看市场的风向。纵观今年电商平台的竞速榜

2025-10-24

双十一相机攻略!佳能R50V直播相机“囤装备”正当时,享年度好价与满赠礼遇
一年一度的双十一购物狂欢节拉开帷幕,正是升级创作装备的绝佳时机!佳能R50V专为视频创作者及直播用户设计的全新机型。这款相机不仅延续了佳能优秀的画质与对焦性能,更在机身设计、视频功能与直播适配性上实现全面突破,成为Vlog、主播及内容创作者的理想拍摄工具。为

2025-10-24

骁龙X2 Elite的能效表现怎么样?如何打破PC的“电量焦虑”
你是否已经习惯了这样的场景?刚插上电源的笔记本生龙活虎,渲染视频、编译代码迅如闪电。但一旦拔掉电源,它就像被拔掉了氧气管,不仅速度骤降,屏幕也变得灰暗,伴随着所剩无几的电量提示,你的创作灵感和工作节奏也被一同“锁死”。我们过去追求的“高性能”,原来是

2025-10-24

携手武汉大学发布全球首个SDL淡彩光情绪图谱,欧普照明引领彩色照明高质量发展
近日,武汉大学携手欧普照明全球首发SDL淡彩光情绪图谱1,首次科学揭示淡彩光对人类积极情绪的影响规律。相关成果获得国际学术权威认可,为健康光环境设计与淡彩光标准化提供权威参考,同时彰显欧普照明以产学研协同创新推动行业高质量发展的前瞻实力。以25种光色科学验

2025-10-24

“AI液冷龙头”Vertiv财报全面超预期,摩根大通:尽管涨幅巨大,但数据中心需求已从“光速”向“荒谬”加速,估值仍然合理
Vertiv第三季度订单同比增长约60%,推动积压订单总额达到创纪录的95亿美元。摩根大通将Vertiv目标价上调至230美元,并指出由AI驱动的数据中心需求正从“光速”向“荒谬”级别加速。Vertiv强劲的订单和项目储备,可能支持其2027年的业绩比当前市场共识高出50%。作为数据

2025-10-24

双十一相机攻略!佳能R50V直播相机“囤装备”正当时,享年度好价与满赠礼遇
一年一度的双十一购物狂欢节拉开帷幕,正是升级创作装备的绝佳时机!佳能R50V专为视频创作者及直播用户设计的全新机型。这款相机不仅延续了佳能优秀的画质与对焦性能,更在机身设计、视频功能与直播适配性上实现全面突破,成为Vlog、主播及内容创作者的理想拍摄工具。为

2025-10-24

创新设计再获认可!猛玛LARK MAX 2荣登《财富》中国最佳设计榜
10月22日,《财富》正式发布年度中国最佳设计榜。猛玛旗舰产品——无线监听麦克风LARK MAX 2,凭借其在工业设计、用户体验与声学技术上的颠覆性创新,成功入围该榜单。今年《财富》榜单的核心命题是:在AI浪潮下,设计如何锚定人文价值,让技术更懂人心?评选标准强调对用户需

2025-10-24

​Soul 兴趣主理人:在世界的褶皱中寻找自我
在浩瀚的网络里,旅行内容常见——从五分钟速通欧洲的“特种兵”攻略,到滤镜厚重的“网红打卡地”,但其千篇一律,让人觉得好像很难再看到旅行本身那种粗砺、真实、甚至有些笨拙的原始魅力。然而,总有一些人,他们行走的轨迹与主流背道而驰,他们记录的方式并非为了迎合算法

2025-10-24

三星携手传奇战队T1:双十一签名显示器臻品拍卖启幕,尖端装备助燃竞技梦想
在全球电竞产业高速发展的浪潮中,三星显示器凭借持续的技术革新与对用户需求的深刻洞察,已连续六年蝉联全球电竞显示器销售额榜首。而队史斩获五座英雄联盟全球总决赛冠军的T1战队,以专注坚守、追求突破的竞技精神,书写了电竞领域的传奇篇章。作为T1战队游戏显示设备

2025-10-24

双十一选空调,还在只比价格?追觅双机械臂空调引领风感新体验
一年一度的双十一大幕已经拉开,家电市场作为核心战场,各大品牌也早已卯足了劲打出年度“史低价”、“击穿底价”等促销力度,希望能以此抢占消费者心智。然而,当代消费者早已不关注价格,而更加注重长期价值。特别是在空调品类中,这种消费理念的转变非常明显。当固定

2025-10-24