在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型最新技术升级及系列产品,为AI产业红利的落地勾勒出清晰路径。董事长刘庆峰在演讲中指出,AI技术的普及需突破四大关键:自主可控的技术底座、软硬一体的融合能力、行业纵深的应用场景以及个性化的用户体验。目前,这一路径已取得实质性进展——由讯飞与头部企业联合打造的300余个“开箱即用”智能体中,已涌现出多个标杆案例。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

发布会上,深度推理大模型讯飞星火X1.5成为焦点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其语言理解、文本生成、逻辑推理等六大核心能力全面对标国际主流,数学能力持续领先,多语言支持覆盖130个语种,整体性能达到GPT-5的95%以上,尤其在拉美、东盟等14个重点语言场景中表现优异。技术突破方面,科大讯飞在自主可控的全国产算力平台上攻克两大难题:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃。全球首发的非自回归语音大模型架构通过并行输出文本序列,将推理成本降低520%,效果提升16%。
软硬一体化解决方案的发布,标志着AI技术向真实场景的深度渗透。科大讯飞推出融合AI与多模态传感器的硬件方案,其中“AI+麦克风阵列技术”赋能的智能办公本X5,凭借上4下4环八麦克风阵列实现超强抗噪,高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90dB噪音环境中仍保持98.69%的识别率。另一项“AI+扬声器阵列技术”则重构立体声场,搭载该技术的智能座舱音响方案iFLYSOUND已量产落地19家车企,出货量突破100万台,车内音效媲美百万级豪车。

多模态交互能力的突破为AI赋予了更人性化的温度。数字人导览“小飞”现场演示了其八大核心技术:远场麦克风识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人生成、个性化记忆库与情感语义分析。这些技术使“小飞”能根据用户历史行为提供个性化推荐,并完成购票、订酒店等复杂任务。发布会还首发两大核心功能:个性化记忆库通过综合用户长期画像、近期反馈与短期对话,实现“千人千面”的交互体验;百变声音复刻技术仅需1秒录音即可复刻任意音色,并支持自定义声音风格。
在应用场景拓展方面,科大讯飞展示了AI在教育、医疗、出行等领域的深度实践。教育领域,星火大模型构建的错因体系包含3大类、3层级、4000余个标签,通过智能批阅机与教师助手实现“作业批改-课堂施教”的小时级闭环,引领教学范式变革。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,可记住用户偏好并提供体征监测,将汽车转化为“第三生活空间”。办公领域,智能办公本X5与听见APP升级后支持说话人识别自动生成会议纪要,手写内容与AI纪要深度融合,更贴合用户习惯。情感陪伴方面,全新发布的“AI星朋友”拥有4.35MOS高保真声音克隆与160余种人设模型,能通过自学习情感模型主动发起对话,让科幻场景成为现实。
生态建设层面,科大讯飞宣布全面开源原生支持RPA的智能体平台Astron,将“大脑”与“手脚”结合,提供八大行业智能体,助力开发者跨越AI应用鸿沟。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会最后,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,依托多语言与自主可控技术,推动AI红利全球共享,为世界提供AI发展的“第二种选择”。







