近期,杭州深度求索人工智能基础技术研究有限公司,作为DeepSeek的关联企业,在人工智能领域取得了新突破,公布了一项专利——“一种针对大语言模型的部署方法及系统”。这一专利的发布,彰显了该公司在人工智能技术研发上的又一里程碑。
该专利聚焦于人工智能的核心技术领域,其独特之处在于将大语言模型的预填充和解码两个阶段,分别部署于高性能计算与大内存配置的设备上。这种创新的分布式部署策略,有效平衡了系统负载,实现了硬件资源的最大化利用。通过避免计算资源的闲置,该方法显著降低了系统延迟,同时大幅提升了吞吐量。
在当前AI技术日新月异的背景下,系统的扩展性和容错性成为了至关重要的考量因素。DeepSeek的这项专利,通过优化资源配置,显著增强了系统应对多样化工作负载的能力。这一创新部署策略,预示着AI模型将更加高效、智能,为各类应用场景提供更加坚实的支持。
DeepSeek的核心产品之一,DeepSeek-V3,凭借其强大的Mixture-of-Experts(MoE)语言模型,拥有高达6710亿个参数,每个token的激活参数达到370亿个。这一技术上的飞跃,无疑将加速AI技术的普及与应用,为各行各业的数字化转型注入强劲动力。