在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,展示了其在大模型技术、软硬一体化解决方案及多模态交互领域的最新突破,并宣布启动“星火点亮全球”计划,推动AI技术红利的全球共享。

发布会上,科大讯飞董事长刘庆峰指出,AI红利的兑现需攻克四大核心:自主可控、软硬一体、行业纵深与个性化。目前,这一路径已取得显著进展。例如,讯飞联合头部企业打造的300多个“开箱即用”智能体中,涌现出多个优秀“AI员工”。其中,“星火行业分析师”成为国内首个通过工信部考试认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。
在技术升级方面,深度推理大模型讯飞星火X1.5正式发布。该模型采用MoE架构,总参数量293B、激活30B,推理效率较前代提升100%,数学能力持续保持国际领先。其多语言能力覆盖超130个语种,整体性能达GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。星火X1.5在自主可控的全国产算力平台上攻克两大技术难题:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现大幅提升,为自主可控技术筑牢“压舱石”。
原创技术方面,科大讯飞全球首发非自回归语音大模型架构,通过并行输出整个文本序列,推理效率相对提升16%,成本下降520%。这一突破为语音交互领域带来新的可能性。
软硬一体化解决方案是AI落地千行百业的关键。科大讯飞发布了融合AI与麦克风阵列、扬声器阵列、摄像头阵列及视觉呈现的软硬件一体方案。例如,讯飞智能办公本X5采用上4下4环八麦克风阵列,抗噪能力远超iPhone 17 Pro,高噪环境下识别准确率达95.08%;讯飞AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声下识别准确率高达97.1%;讯飞双屏翻译机2.0在90dB噪音下识别率达98.69%。业界首个软硬一体讯飞同传麦克风支持自动翻译免切换,同传播报首响延迟低于2秒,并支持私有化部署。

在视觉与健康技术领域,讯飞AI黑板搭载全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,拥有130度超宽域显示;科大讯飞AI学习机集成微纳米类纸屏等技术,获得国内外10余项权威护眼认证。通过“AI+扬声器阵列技术”,智能座舱音响方案iFLYSOUND实现立体空间声场重构,车内音效媲美百万豪车,已在19家车企量产,出货超100万台。
多模态交互能力方面,数字人导览“小飞”展示了八项技术突破,包括麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈等。其中,个性化记忆能力通过构建用户记忆库,综合理解长期画像、近期反馈与短期对话;百变声音复刻技术基于星火语音大模型,仅需一句录音即可复刻任意音色,并支持指令创造任意风格声音。刘庆峰表示:“超拟人多模态交互将是未来AI进入家庭的标配。”
在应用场景拓展上,星火大模型在教育、医疗、汽车、办公及情感陪伴领域实现深度落地。教育领域,星火大模型首创由3大类、3层级、4000+标签构成的错因体系,通过智能批阅机和教师助手实现“小时级闭环”,引领教学范式变革。医疗领域,星火医疗大模型专科AI诊疗能力达等级医院主任级医师水平,人机协同使诊断合理率从87%提升至96%,病历书写时间减半。汽车领域,星火智慧座舱2.0融合13个摄像头,通过54维2808个记忆锚点记住用户偏好,并提供5项体征实时监测。办公领域,讯飞智能办公本X5和听见APP升级后,可基于说话人识别自动生成会议纪要和待办事项。情感陪伴方面,“AI星朋友”作为成长伙伴,拥有自然度4.35MOS的高保真声音克隆和超160种人设模型,并能主动电话用户。

为繁荣AI生态,科大讯飞发布并全面开源首个原生支持RPA的智能体平台Astron,将Agent与RPA结合,提供“开箱即用”的八大行业智能体。2025年AI开发者大赛吸引17个国家36,898个团队参与,涌现出4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,其中大模型企业开发者增长125%。
发布会最后,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,依托星火的多语言与自主可控技术,与全球伙伴深度合作,为世界提供AI发展的“第二种选择”,加速技术红利全球共享。




