Qafind Labs发布ChatDLM：文档级生成新纪元，2800tokens/s推理速度引关注-人工智能-ITBear科技资讯

近期，Qafind Labs震撼发布了其倾力打造的ChatDLM模型，这一人工智能领域的创新力作迅速吸引了业界的广泛关注。ChatDLM模型开创性地将“区块扩散”与“专家混合”两大技术完美融合，不仅在性能上实现了飞跃，更开启了文档级生成与实时对话的新篇章。

ChatDLM的技术架构是其核心竞争力所在。该模型拥有7B的参数量，借助区块扩散技术，将输入数据巧妙地分割成多个区块，并通过空间扩散与跨块注意力机制，显著提升了数据处理速度。同时，模型引入了专家混合（MoE）技术，配置了32至64个专家，每次灵活选择2个专家进行处理，这一机制进一步强化了模型的性能表现。

为了支持超长上下文的处理，ChatDLM采用了RoPE优化技术和分层缓存技术，极大地增强了模型的记忆能力。在推理优化方面，该模型通过一系列先进技术，如动态早停、BF16混合精度以及ZeRO分片等，实现了多GPU的无缝扩展，从而进一步提升了模型的运行效率和可扩展性。

在性能测试中，ChatDLM展现出了惊人的实力。在A100GPU上，其吞吐量高达2800tokens/s，能够处理长达131，072tokens的上下文，平均迭代步数在12至25之间。在Humaneval（0-shot）测试中，ChatDLM的准确率高达92.0%，Fill-in-the-Middle测试准确率为84.2%，ARC-E(0-shot)测试准确率也达到了83.9%。这些令人瞩目的数据，充分证明了ChatDLM的卓越性能。

目前，Qafind Labs已经为ChatDLM提供了体验地址：https://www.chatdlm.cn，供广大用户亲身体验这一创新模型的强大功能。

从“吉林一号”卫星视角：探吉林遥感产业创新路与多元应用新篇

2025-09-22

OpenAI携手立讯精密开发消费级设备，歌尔股份或参与扬声器模块供应

2025-09-22

2025年10月15日深圳见！OPPO开发者大会携ColorOS 16与AI战略重磅登场

2025-09-22

华泰证券研报：OpenAI布局硬件领域，中国硬件生产商未来两年前景向好

2025-09-22

华为昇腾路线图发布国产算力与模型协同共进 2026年或迎发展高潮

2025-09-22

星宸科技布局下一代高端智能机器人芯片，预计2026年上市助力AI与机器人算法升级

2025-09-22

DeepSeek论文登《自然》封面，纯强化学习提升推理力，科技板块迎资金热潮

近日，由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文，登上了国际权威期刊《自然（Nature）》第645期的封面。一是实现混合推理架构，即一个模型同时支持思考模式与…

2025-09-22

索尼AI战略明晰：以AI赋能创作，拓展娱乐体验新边界

IT之家援引博文介绍，该系统不仅连接聊天与文本助手，还融入核心业务流程，已测试 300 多个 AI 相关项目，其中至少 50个投入常规使用。公司正将生成式 AI 与机器学习用于老片音频重制，并在 Play…

2025-09-22

华为全联接大会发布全球最强算力超节点与集群，助力AI算力持续发展

IT之家 9 月 18 日消息，今日，华为全联接大会 2025 在上海启幕，华为副董事长、轮值董事长徐直军发表题为“以开创的超节点互联技术，引领AI 基础设施新范式”的主题演讲，正式发布全球最强算力超节点和…

2025-09-22

姚期智谈“AI+量子”：融合发展开启量子智能新时代，潜力无限待挖掘

9月21日，在以“AI量子：量子智能”为主题的2025浦江创新论坛专题论坛上，中国科学院院士、上海期智研究院院长姚期智表示，推动人工智能与量子计算机融合发展，将把计算能力推向人类认知的一个极限，量子智能激发…

2025-09-22