在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,全面展示了其在人工智能领域的最新突破。这场科技盛会不仅发布了深度推理大模型讯飞星火X1.5,更通过软硬一体化解决方案、多模态交互技术等创新,为AI产业红利的兑现描绘出清晰路径。

讯飞星火X1.5的发布成为全场焦点。这款采用MoE架构的大模型总参数量达293B,激活参数量30B,推理效率较前代提升100%。其六大核心能力——语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力——全面对标国际主流,其中数学能力持续保持国际领先水平。更引人注目的是,星火X1.5的多语言能力覆盖超过130个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出,为全球AI发展提供了“第二选择”。
在自主可控技术领域,科大讯飞攻克了两大关键难题。通过优化长思维链强化学习训练效率,深度推理训练效率从30%提升至84%以上;同时实现了MoE模型全链路训练效率的大幅提升。全球首发的非自回归语音大模型架构通过并行输出整个文本序列,将推理成本降低520%,效果相对提升16%。这些突破为国产算力平台奠定了坚实基础。
软硬一体化解决方案的推出,标志着AI技术向真实世界的深度渗透。科大讯飞发布的软硬件一体方案融合了AI与麦克风阵列、扬声器阵列、摄像头阵列等技术。其中,讯飞智能办公本X5采用上4下4环八麦克风阵列,在高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;讯飞AI翻译耳机通过单耳三麦多感融合降噪系统,在复杂噪声下识别准确率高达97.1%;讯飞双屏翻译机2.0在90dB噪音下识别率达98.69%。这些产品通过独家“AI+硬件”技术,重新定义了智能设备的交互体验。
在视觉与健康技术方面,科大讯飞同样展现了创新实力。讯飞AI黑板搭载的全球首款圆偏类自然光护眼大屏,将视觉疲劳降低50%,并拥有130度超宽域显示;AI学习机集成的微纳米类纸屏技术获得国内外10余项权威护眼认证。智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已在19家车企量产落地,出货量超过100万台,车内音效媲美百万豪车。

多模态交互技术的突破为AI赋予了更丰富的情感维度。数字人导览“小飞”展示了八项核心能力:麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义。其中,个性化记忆能力通过构建用户记忆库,实现对用户长期画像、近期反馈、短期对话的综合理解;百变声音复刻技术仅需一句录音即可复刻任意音色,并支持创造任意风格的声音。这些技术使AI从工具升级为“有温度的伙伴”。
在应用场景拓展方面,科大讯飞展示了AI在教育、医疗、汽车、办公等领域的深度实践。教育领域,星火大模型构建的错因体系获得国家数学课程标准修订组组长曹一鸣教授领衔的专家组权威鉴定,通过智能批阅机和教师助手实现教学“小时级闭环”。医疗领域,星火医疗大模型达到等级医院主任级医师水平,人机协同将诊断合理率从87%提升至96%,“智医助理医院版1.0”和“讯飞晓医”APP累计完成1.6亿次AI健康咨询。汽车领域,星火智慧座舱2.0通过54维2808个记忆锚点记住用户偏好,提供5项体征实时监测。办公领域,讯飞智能办公本X5和听见APP支持基于说话人识别的会议纪要生成,手写纪要与AI纪要深度融合。
生态建设方面,科大讯飞启动“星火点亮全球”计划,与多国合作伙伴共建AI新生态。2025年AI开发者大赛吸引17个国家36,898个团队参与,涌现出4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,其中大模型企业开发者增长125%。面向开发者,科大讯飞全面开源首个原生支持RPA的智能体平台Astron,提供“开箱即用”的八大行业智能体,推动中国开发者在全球创新中占据主动。









