ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

腾讯发布Hunyuan-Large大模型:389B总参数与52B激活参数,业界领先!

时间:2024-11-05 17:14:18来源:ITBEAR编辑:瑞雪

【ITBEAR】腾讯近日推出了业界领先的Hunyuan-Large大模型,该模型基于Transformer架构,并采用了MoE(Mixture of Experts)设计。据悉,这是目前业界已经开源的最大规模的MoE模型,拥有惊人的3890亿总参数和520亿激活参数。

腾讯在Hugging Face平台上开源了Hunyuan-A52B的三个版本,包括预训练版、指令版和指令版FP8,同时发布了详尽的技术报告与操作手册,供开发者深入了解模型的功能及操作方法。

Hunyuan-Large模型具备多项技术优势,例如通过高质量合成数据增强训练,使模型能够学习到更为丰富的数据表示,有效处理长上下文输入,并提升了对未见数据的泛化能力。模型还采用了创新的KV缓存压缩技术,通过分组查询注意力和跨层注意力策略,大幅降低了内存占用和计算成本,从而提高了推理效率。

该模型还引入了专家特定学习率缩放技术,为不同的专家子模型设定了差异化的学习率,确保了每个子模型都能从数据中高效学习,并为模型的整体性能作出贡献。在长上下文处理能力方面,Hunyuan-Large也表现出色,其预训练模型支持处理长达256K的文本序列,而指令版模型则支持128K的文本序列,显著增强了处理长上下文任务的能力。

为了验证模型的实际应用效果和安全性,腾讯在多种语言和任务上进行了广泛的基准测试。测试结果充分证明了Hunyuan-Large模型的卓越性能和广泛适用性。

对于想要深入了解Hunyuan-Large模型的开发者和研究者,腾讯提供了丰富的资源链接,包括论文、Github仓库、Huggingface模型库以及腾讯云上的相关产品页面。

更多热门内容
美团单车背后的科技公司跨界了!新增智能机器人研发,未来有何新布局?
鞭牛士11月6日消息,天眼查App显示,美团单车关联公司北京摩拜科技有限公司近日发生工商变更,经营范围新增智能机器人的研发、物联网技术研发、人工智能基础软件开发等业务。 该公司成立于2015年1月,法定代表…

2024-11-06

苹果预警:涉足AI与VR新兴市场,新产品利润难匹敌iPhone
苹果公司表示,未来推出的产品、服务和技术可能会对现有业务产生替代性影响,并可能带来较低的营收和利润率,这将对苹果的业务、运营和财务状况产生不利影响。 据悉,苹果目前正加大对人工智能的投入,力图在该领域缩小与…

2024-11-06