ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AMD出手了!首款小语言模型“Llama-135m”亮相

时间:2024-09-29 18:25:09来源:ITBEAR编辑:快讯团队

【ITBEAR】9月29日消息,AMD近期在Huggingface平台发布了其首款“小语言模型”AMD-Llama-135m,该模型拥有6700亿个token,并采用了Apache 2.0开源许可。这款模型的核心优势在于其“推测解码”功能,该功能通过小型草稿模型生成候选token,再经由大型目标模型验证,显著提升了效率并降低了RAM占用。

据悉,AMD-Llama-135m模型在四个AMD Instinct MI250节点上进行了六天的训练,而其特定于编程的变体AMD-Llama-135m-code则额外耗费了四天时间进行微调。这种训练方法使得模型能够在保持高性能的同时,每次前向传递生成多个token,从而实现了效率的显著提升。

通过这一创新,AMD展示了其在语言模型领域的实力,为开发者和研究人员提供了更多选择和可能性。

更多热门内容
上海凯鑫业绩“过山车”,信披滞后谜团待解,行业复苏能否助力反转?
言外之意,基于上述订单的签约,上海凯鑫自认为2024年扣除非经常性损益后的营收将超过1亿元,且扣非前后净利润仍然保持盈利,故没有提前作出业绩预告;事后发现,公司初步内审预测不被外审计机构认可,遂做出调整。 …

2025-04-18

超聚变探索者大会2025 | 质上加智,共建车桩网智能体
4月15日-17日,超聚变探索者大会2025在郑州国际会展中心举行。大会期间,超聚变正式发布智慧能源解决方案1.0战略“质上加智,共建车桩网智能体”及FusionWatt系列新品,为充电网络转型提供创新思路与解决方案。超聚变智慧能源解决方案总裁程肇超聚变智慧能源解决方案总

2025-04-18

超聚变探索者大会2025|“1+1+3”新品发布,超聚变邀您共绘城企数智业务蓝图
4月15-17日,超聚变探索者大会2025在郑州国际会展中心举行。大会期间,超聚变全新发布1个服务解决方案——xIBT业务变革与数智化转型服务解决方案;1个平台-xRAY智能数据与AI使能平台(包括基于平台开发的业务智能体);3个企业核心商业应用(xERP企业核心经营系统、xCRM客户

2025-04-18