在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型X1.5版本及一系列创新产品,系统描绘了AI技术从实验室走向产业应用的实践路径。此次发布的技术成果覆盖自主算力突破、软硬一体解决方案、多模态交互升级三大领域,标志着中国AI企业在关键核心技术领域实现从跟跑到并跑的跨越。

在自主算力攻坚方面,星火X1.5采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。该模型在数学推理、代码生成等六大核心能力上全面对标国际顶尖水平,其中数学能力持续保持领先。多语言支持覆盖130个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景实现效果超越。更值得关注的是,科大讯飞在国产算力平台上攻克两大技术瓶颈:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃,为AI大模型国产化奠定坚实基础。技术突破带来显著成本优势,其全球首发的非自回归语音大模型架构,推理成本较同类自回归模型下降520%,效果反而提升16%。
软硬一体化解决方案成为连接数字世界与物理世界的关键桥梁。基于独家“AI+麦克风阵列”技术,讯飞智能办公本X5搭载上下双层八麦克风阵列,在85分贝高噪环境下仍保持95.08%的识别准确率,远超iPhone 17 Pro。AI翻译耳机首创单耳三麦克风降噪系统,复杂噪声场景识别率达97.1%;双屏翻译机2.0在90分贝极端噪音中仍能实现98.69%的精准识别。在声场重构领域,iFLYSOUND智能座舱音响方案通过扬声器阵列技术实现立体空间音效,已与19家车企达成量产合作,累计出货超百万台。教育场景中,全球首款圆偏类自然光护眼大屏使视觉疲劳降低50%,130度超宽视角确保教室全员清晰观摩;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。
多模态交互能力升级推动AI向“类人伙伴”演进。数字人导览员“小飞”现场演示了八大核心技术突破:远场麦克风识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人生成、个性化记忆构建及情感语义理解。这些技术联动使AI具备上下文记忆能力,可根据用户历史行为提供个性化服务。发布会首发的两大核心技术中,个性化记忆系统通过构建用户画像库,实现长期偏好、近期反馈与短期对话的综合分析;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持风格化声音创作。科大讯飞董事长刘庆峰强调:“当AI具备情感理解与记忆能力,它将从工具升级为真正懂用户的伙伴。”

应用场景拓展方面,星火大模型正在重塑多个行业生态。教育领域首创的4000+标签错因分析体系,通过智能批阅机与教师助手实现“作业批改-学情分析-因材施教”小时级闭环,该成果获国家数学课程标准修订组专家权威认证。医疗领域,专科诊疗能力达到三甲医院主任级水平,人机协同使基层诊断合理率从87%提升至96%,病历书写效率翻倍。全新发布的“智医助理医院版1.0”已具备辅助诊疗、病历生成等核心功能,“讯飞晓医”个人健康助手累计完成1.6亿次咨询,支持99%医学报告解析。出行场景中,星火智慧座舱2.0通过54维记忆锚点记录用户偏好,融合13个摄像头实现5项体征监测,将汽车转变为“第三生活空间”。办公领域,智能办公本X5的手写纪要与AI生成内容深度融合,听见APP可自动提取会议待办事项,显著提升工作效率。情感陪伴赛道迎来突破,AI星朋友搭载160种人设模型与自学习情感引擎,能主动发起电话交流,其4.35MOS值的高保真语音克隆技术使虚拟陪伴更具真实感。
生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,该平台整合Agent决策大脑与RPA自动化手脚,提供金融、医疗等八大行业“开箱即用”解决方案。2025年AI开发者大赛吸引17国3.6万个团队参与,诞生4622个垂直领域智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会最后,科大讯飞联合多国合作伙伴启动“星火点亮全球”计划,旨在通过多语言技术与自主算力优势,构建开放共赢的AI国际生态,为全球用户提供除西方技术路径外的“第二种选择”。