在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,推出讯飞星火大模型最新技术升级及系列创新产品,全面描绘AI技术赋能产业发展的实践路径。此次发布不仅展现了自主可控技术体系的突破,更通过多领域应用场景的落地,为全球AI生态建设注入新动能。

深度推理大模型星火X1.5的亮相成为技术突破的焦点。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,在保持国际领先的数学能力基础上,推理效率较前代提升100%,整体性能达到GPT-5的95%以上。其多语言支持覆盖130个语种,在拉美、东盟等14个重点语言场景中表现优异。值得关注的是,星火X1.5在国产算力平台上攻克两大核心难题:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为自主可控技术体系奠定坚实基础。全球首发的非自回归语音大模型架构通过并行输出机制,将推理成本降低520%,效果提升16%,开创语音处理新范式。
软硬一体化解决方案的推出标志着AI技术向真实场景的深度渗透。基于独家“AI+麦克风阵列技术”,讯飞智能办公本X5搭载上4下4环八麦克风阵列,在95分贝高噪环境下仍保持95.08%的识别准确率,超越iPhone 17 Pro;AI翻译耳机采用单耳三麦多感融合系统,复杂噪声下识别率达97.1%;双屏翻译机2.0在90分贝环境中实现98.69%的识别率。在视觉呈现领域,智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已在19家车企量产,累计出货量超100万台。教育场景中,AI黑板搭载的圆偏类自然光护眼大屏使视觉疲劳降低50%,130度超宽域显示确保教室全覆盖;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。
多模态交互能力的革新重新定义了人机关系。数字人导览“小飞”现场演示了八大核心技术突破:远场麦克风识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人生成、个性化记忆构建及情感语义分析。其中,个性化记忆系统通过用户画像、近期反馈与短期对话的综合分析,实现真正的“懂你”交互;百变声音复刻技术仅需1秒录音即可克隆任意音色,并支持风格化声音创造。科大讯飞董事长刘庆峰强调:“超拟人多模态交互将成为AI进入家庭的标准配置,让技术真正具备情感温度。”

应用场景的拓展彰显AI技术的普惠价值。教育领域,星火大模型构建的4000+标签错因体系通过权威鉴定,智能批阅机与教师助手形成“小时级闭环”,推动因材施教范式变革;医疗领域,星火医疗大模型达到主任级医师诊疗水平,人机协同使基层诊断合理率提升至96%,病历书写时间减半,“智医助理医院版1.0”与个人健康助手“讯飞晓医”累计完成1.6亿次健康咨询;出行领域,星火智慧座舱2.0通过54维记忆锚点记录用户偏好,提供体征监测与场景化服务;办公场景中,智能办公本X5实现手写纪要与AI生成的深度融合,听见APP可自动生成会议纪要与待办事项;情感陪伴方面,“AI星朋友”凭借4.35MOS高保真声音克隆与160种人设模型,通过自学习情感模型主动提供关怀,让科幻场景成为现实。
生态建设的加速推进为全球开发者创造新机遇。2025年AI开发者大赛吸引17国36,898个团队参与,催生4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会上,原生支持RPA的智能体平台Astron正式开源,该平台整合Agent决策能力与RPA自动化执行,提供八大行业智能体模板,助力开发者跨越AI应用门槛。同期启动的“星火点亮全球”计划,将依托多语言优势与自主技术,与全球伙伴共建AI生态,为世界提供技术发展的“第二种选择”。









