在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,向全球展示了其在大模型技术、软硬一体化解决方案及多领域应用等方面的最新突破。这场盛会不仅吸引了来自17个国家的36,898个开发者团队参与,更通过一系列创新成果,勾勒出AI技术从实验室走向千行百业的清晰路径。

深度推理大模型“星火X1.5”的发布成为全场焦点。该模型采用混合专家(MoE)架构,总参数量达2930亿,激活参数300亿,推理效率较前代提升100%。在数学能力、多语言支持等核心指标上,星火X1.5不仅全面对标国际主流模型,更在130余种语言中实现超越,其中拉美、东盟等14个重点语言的处理效果领先全球。值得关注的是,该模型在国产算力平台上攻克了两大技术难题:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为AI自主可控发展奠定坚实基础。非自回归语音大模型架构的全球首发,则通过并行输出技术将推理成本降低520%,效果提升16%,重新定义了语音交互的效率标准。
软硬一体化解决方案的推出,标志着AI技术向真实场景的深度渗透。科大讯飞打造的“AI+麦克风阵列”技术,在智能办公本X5上实现八麦克风环阵布局,高噪环境识别准确率达95.08%,超越iPhone 17 Pro;AI翻译耳机采用单耳三麦融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90分贝噪音中仍保持98.69%的识别率。扬声器阵列技术与自研算法的结合,让智能座舱音响方案iFLYSOUND在19家车企量产落地,出货量突破100万台,车内音效媲美百万级豪车。教育领域,全球首款圆偏类自然光护眼大屏搭载于讯飞AI黑板,视觉疲劳降低50%,130度超宽域显示确保教室每个角落清晰可见;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。
多模态交互能力的突破,让AI从工具升级为情感伙伴。数字人导览“小飞”现场演示了其八大核心能力:通过麦克风远场识别、3D视觉感知等技术,实现多人多语种对话;基于个性化记忆库,可根据用户历史行为提供定制化推荐;超拟人数字人技术则让交互更具情感温度。发布会首发的“百变声音复刻”功能,仅需1秒录音即可复刻任意音色,并支持风格化声音创造;“个性化记忆”技术通过综合分析用户长期画像、近期反馈及短期对话,使AI真正理解用户需求。这些创新被科大讯飞董事长刘庆峰视为“AI进入家庭的标准配置”。

在垂直领域应用中,星火大模型展现出强大的场景适应力。教育领域,其构建的4000+标签错因体系通过权威鉴定,智能批阅机与教师助手形成“小时级闭环”,推动教学范式变革;医疗领域,专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,AI健康助手“讯飞晓医”累计完成1.6亿次咨询;出行领域,星火智慧座舱2.0通过54维记忆锚点记住用户偏好,提供体征监测与个性化服务;办公场景中,智能办公本X5的手写纪要与AI生成内容深度融合,讯飞听见APP可自动识别说话人生成会议纪要;情感陪伴方面,“AI星朋友”凭借160余种人设模型与自学习情感引擎,能主动发起通话,让科幻场景成为现实。
生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,提供八大行业“开箱即用”解决方案,助力开发者跨越AI应用鸿沟。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。启动的“星火点亮全球”计划,将依托多语言与自主可控技术,与全球伙伴共建AI发展新生态,为世界提供不同于西方技术路径的“第二种选择”。正如刘庆峰所言:“AI不应是冰冷的科技,而是赋能每个人创造温暖未来的力量。”这场发布会,正是这一理念的生动实践。









