ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Qafind Labs发布ChatDLM:文档级生成新纪元,2800tokens/s推理速度引关注

时间:2025-04-28 08:42:40来源:ITBEAR编辑:快讯团队

近期,Qafind Labs震撼发布了其倾力打造的ChatDLM模型,这一人工智能领域的创新力作迅速吸引了业界的广泛关注。ChatDLM模型开创性地将“区块扩散”与“专家混合”两大技术完美融合,不仅在性能上实现了飞跃,更开启了文档级生成与实时对话的新篇章。

ChatDLM的技术架构是其核心竞争力所在。该模型拥有7B的参数量,借助区块扩散技术,将输入数据巧妙地分割成多个区块,并通过空间扩散与跨块注意力机制,显著提升了数据处理速度。同时,模型引入了专家混合(MoE)技术,配置了32至64个专家,每次灵活选择2个专家进行处理,这一机制进一步强化了模型的性能表现。

为了支持超长上下文的处理,ChatDLM采用了RoPE优化技术和分层缓存技术,极大地增强了模型的记忆能力。在推理优化方面,该模型通过一系列先进技术,如动态早停、BF16混合精度以及ZeRO分片等,实现了多GPU的无缝扩展,从而进一步提升了模型的运行效率和可扩展性。

在性能测试中,ChatDLM展现出了惊人的实力。在A100GPU上,其吞吐量高达2800tokens/s,能够处理长达131,072tokens的上下文,平均迭代步数在12至25之间。在Humaneval(0-shot)测试中,ChatDLM的准确率高达92.0%,Fill-in-the-Middle测试准确率为84.2%,ARC-E(0-shot)测试准确率也达到了83.9%。这些令人瞩目的数据,充分证明了ChatDLM的卓越性能。

目前,Qafind Labs已经为ChatDLM提供了体验地址:https://www.chatdlm.cn,供广大用户亲身体验这一创新模型的强大功能。

更多热门内容
腾讯混元-O:全球首个全模态模型即将面世,剑指“世界模型”
新榜讯 5 月 25 日,据钛媒体报道,腾讯自研大模型混元旗下的首个端到端语音通话模型 Hunyuan-Voice 预计最快于今年 6月在腾讯元宝 App 上线,以此与豆包 AI 视频通话功能展开竞争。此外…

2025-05-26

蔡崇信:阿里五年磨砺坚韧,电商云计算为核心,AI全面渗透业务重归正轨
新榜讯 5 月 21 日至 24 日,第五届 BEYOND 国际科技创新博览会(BEYOND Expo 2025)举行。闭幕式上,阿里巴巴集团董事长蔡崇信透露,过去五年,阿里遭遇众多挫折,在此阶段学会了坚韧,…

2025-05-25