腾讯发布Hunyuan-Large大模型：389B总参数与52B激活参数，业界领先！-人工智能-ITBear科技资讯

【ITBEAR】腾讯近日推出了业界领先的Hunyuan-Large大模型，该模型基于Transformer架构，并采用了MoE（Mixture of Experts）设计。据悉，这是目前业界已经开源的最大规模的MoE模型，拥有惊人的3890亿总参数和520亿激活参数。

腾讯在Hugging Face平台上开源了Hunyuan-A52B的三个版本，包括预训练版、指令版和指令版FP8，同时发布了详尽的技术报告与操作手册，供开发者深入了解模型的功能及操作方法。

Hunyuan-Large模型具备多项技术优势，例如通过高质量合成数据增强训练，使模型能够学习到更为丰富的数据表示，有效处理长上下文输入，并提升了对未见数据的泛化能力。模型还采用了创新的KV缓存压缩技术，通过分组查询注意力和跨层注意力策略，大幅降低了内存占用和计算成本，从而提高了推理效率。

该模型还引入了专家特定学习率缩放技术，为不同的专家子模型设定了差异化的学习率，确保了每个子模型都能从数据中高效学习，并为模型的整体性能作出贡献。在长上下文处理能力方面，Hunyuan-Large也表现出色，其预训练模型支持处理长达256K的文本序列，而指令版模型则支持128K的文本序列，显著增强了处理长上下文任务的能力。

为了验证模型的实际应用效果和安全性，腾讯在多种语言和任务上进行了广泛的基准测试。测试结果充分证明了Hunyuan-Large模型的卓越性能和广泛适用性。

对于想要深入了解Hunyuan-Large模型的开发者和研究者，腾讯提供了丰富的资源链接，包括论文、Github仓库、Huggingface模型库以及腾讯云上的相关产品页面。