中昊芯英近日正式发布全新自主研发的高性能TPU AI专用芯片“须臾”,同时推出配套的软硬件一体化智算底座“泰则2.0”。这一系列创新成果标志着国产AI算力领域取得重要突破,为政务、金融、能源等关键行业提供了更安全、高效的解决方案。
据技术团队介绍,“须臾”芯片在混合精度浮点算力方面达到896 TFLOPS,是前代产品“刹那”的三倍性能提升。针对高并发推理场景,其8-bit推理算力更突破至1792 TOPS,配合大幅提升的显存带宽和芯片间互联速率,可支持超长上下文处理需求。值得注意的是,该芯片单卡功耗控制在600W,较传统方案降低50%,为构建绿色数据中心提供了有力支撑。
研发团队特别强调,从芯片IP核到专属指令集,从底层算子库到整机系统软件,“须臾”实现了全链条自主可控,彻底摆脱对海外技术的依赖。这种全栈自研能力使其特别适用于对数据安全要求严苛的政务、金融及电网等领域,能够满足相关行业的合规性标准。
同步推出的“泰则2.0”智算平台采用创新架构设计,每台标准计算单元整合两路高性能CPU与8片TPU处理单元,形成CPU服务器与TPU加速设备的物理级组合。在混合精度算力测试中,该平台展现出7.168P的强大性能,而整机能耗仅为传统GPU服务器的80%,显著降低了大规模AI训练的运营成本。
软件生态建设方面,“泰则2.0”实现了对主流AI框架的全面兼容,原生支持PyTorch、vLLM等开发工具,并针对DeepSpeed、Megatron-LM等分布式训练套件进行优化。目前平台已完成与Qwen全系列、DeepSeek、GLM等数十个主流大语言模型的深度适配,开发者可快速实现模型迁移部署,大幅缩短项目落地周期。