ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

PyTorch新利器torchao发布:AI模型效率飞跃,你准备好了吗?

时间:2024-10-02 13:55:19来源:ITBEAR编辑:瑞雪

【ITBEAR】PyTorch官方近日宣布,旗下全新架构优化库torchao已正式上线。该库专注于模型的量化和稀疏性优化,致力于在保障性能的同时,降低AI模型的计算成本及RAM占用,从而提升其运行效率。

torchao提供了一整套优化工具,特别针对如LLaMA 3等热门AI模型进行性能提升。通过支持float8、int4等低精度数据类型,该库能有效减轻硬件负担,减少内存使用。

在LLaMA 3 70B模型的预训练过程中,torchao展现了显著效果。其float8训练流程能提升模型计算速度达1.5倍,开发者仅需调用convert_to_float8_training函数,便可轻松实现模型的高效训练转换。

在推理方面,torchao提供了包括权重量化和动态激活量化在内的多种量化策略,供用户灵活选择,以达到最佳的模型推理效果。

在稀疏性优化领域,torchao同样表现出色。它不仅能提升模型参数的计算效率,还能显著降低显存占用。例如,在ViT-H模型的推理中,torchao可提升速度达5%。同时,通过将LLaMA 3.1 8B模型的权重量化为int4,并将键值缓存量化为int8,torchao使得该模型在完整的128K上下文长度下,显存占用仅需18.9GB。

更多热门内容
三星芯片业务Q3业绩未达预期,全永铉罕见致歉,未来何去何从?
10 月 8 日消息,三星电子今日公布了其 2024年第三季度的收益指引,利润和营收均未达到市场预期,引发了对其关键芯片部门前景的不确定性担忧。 考虑到三星电子芯片部门最近几周的困境,分析师大幅下…

2024-10-08

欧洲航天局Hera探测器升空,将揭秘DART撞击小行星的“宇宙级”实验效果!
10 月 8 日消息,欧洲航天局(ESA)的 Hera 探测器于美国东部时间 10 月 7 日搭乘 SpaceX 的猎鹰 9号火箭从美国佛罗里达州卡纳维拉尔角发射升空,将前往 2022 年被美国宇…

2024-10-08

新能源黑马!车长胜理想L8,价格亲民,4.9秒破百带四驱,豪华配置一应俱全!
外观部分咱们简单带过,相比老款蓝山,2025款蓝山在外观上的改变比较细微。新款蓝山在动力系统和底盘悬架方面进行升级。4挡DHT的加入,在燃油经济性和发动机噪音控制方面均得到提升,高速行驶品质比老款车型加强。中…

2024-10-08

新款特斯拉Model 3亮相:外观向Model Y看齐,你会喜欢吗?
日前,海外曝光了新款特斯拉Model3的谍照,不过此次谍照相当隐蔽,很难看出新款车型到底改在了哪。可以肯定,Model3似乎又要迎来新款造型,或许特斯拉想给Model3的销量再添一把火,搞个重磅发布,和新款M…

2024-10-08

特斯拉悄然调价,车主竟赞其厚道,这是怎么回事?
特斯拉在国内纯电车市场中具有明显优势,尤其是在新能源汽车价格战中,特斯拉并未受影响。特斯拉Model Y凭借其稳健的销量表现和保值率,给用户带来了信心。在补贴潮兴起时,特斯拉也积极应对,江苏地区提供置换更新补贴,具体补贴金额根据车型和...

2024-10-08

奔驰GLE国产版加长来袭,6座7座布局,舒适度超越理想L9?
奔驰GLE一直以进口形式在华销售,此前推出过7座车型,但由于受到尺寸的限制,第三排只能勉强乘坐,毫无舒适度可言。奔驰不久前宣布,将在中国投产GLE长轴距版,同时提供6座和7座车型。参考GLCL的加长策略,预计…

2024-10-08