在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞正式推出深度推理大模型"讯火星火X1.5",同步展示多领域AI软硬件解决方案及行业应用成果。这款采用混合专家(MoE)架构的新模型总参数量达2930亿,其中激活参数300亿,在语言理解、逻辑推理、数学运算及代码生成等核心能力上实现显著突破,现已支持130余种语言交互。
据技术团队介绍,星火X1.5通过优化长思维链强化学习机制,将深度推理训练效率从30%提升至84%以上,同时改进MoE训练链路设计,在保持性能的前提下降低能耗与部署成本。值得关注的是,同步发布的非自回归语音大模型采用并行输出技术,推理效率提升16%的同时,单次推理成本下降520%,可实现完整文本序列的实时生成。
科大讯飞董事长刘庆峰重点演示了两大创新功能:基于用户画像的个性化记忆系统,通过构建动态记忆库实现长期偏好、近期反馈与即时对话的智能整合;以及百变声纹复刻技术,仅需3秒音频样本即可精准复刻任意音色,并支持跨语言风格迁移。现场演示中,系统成功模拟出不同年龄、性别、地域的语音特征,引发开发者热烈讨论。
在应用生态建设方面,科大讯飞推出首款支持RPA流程自动化的智能体开发平台"Astron",已联合行业头部企业打造300余个垂直领域智能体。其中"星火行业分析师"通过工信部专业认证,具备复杂数据解析能力。数据显示,讯飞开放平台开发者数量突破968万,2025年内新增200万注册用户,大模型相关开发者同比增长125%,形成覆盖办公、医疗、教育等场景的完整解决方案矩阵。
现场展区集中呈现了多模态交互设备的最新进展:智能办公本X5实现会议纪要实时转写与多语言互译;AI翻译耳机突破环境噪音干扰,支持83种语言在线翻译;双屏翻译机通过分屏设计提升跨境商务沟通效率。医疗领域推出的智医助理1.0系统可辅助生成规范病历,教育板块的AI批阅系统则能实现作文智能评改与学情分析。
技术突破背后是自主可控的算力支撑。刘庆峰强调,星火系列成为国内首个完全基于国产算力训练的通用大模型,其训练集群采用分布式架构设计,在保障数据安全的同时,实现训练效率与模型精度的平衡。这种技术路线为AI大规模商业化落地提供了可复制的范本,特别是在对数据主权要求严格的行业领域具有战略价值。


