在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,全面展示了讯飞星火大模型的最新技术突破与多领域应用成果,为全球AI发展提供了全新路径。此次发布不仅聚焦技术自主创新,更通过软硬一体解决方案和多模态交互能力,推动AI从实验室走向千行百业。
发布会上,深度推理大模型讯飞星火X1.5正式登场。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其语言理解、文本生成、数学能力等六大核心指标全面对标国际主流,其中数学能力持续领先,多语言支持覆盖130个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。科大讯飞董事长刘庆峰透露,星火X1.5在国产算力平台上攻克了两大技术难题:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃,为自主可控AI发展奠定坚实基础。全球首发的非自回归语音大模型架构通过并行输出文本序列,推理效率提升16%,成本降低520%,成为原创技术的重要突破。
软硬一体化解决方案成为AI落地关键支撑。科大讯飞推出融合AI与麦克风阵列、扬声器阵列、摄像头阵列的软硬件一体方案,覆盖办公、翻译、同传等多场景。例如,智能办公本X5搭载上4下4环八麦克风阵列,高噪环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦多感融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0在90dB噪音下仍保持98.69%的识别率。同传麦克风则实现自动翻译免切换,首响延迟低于2秒,支持私有化部署。在扬声器技术领域,智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,已量产落地19家车企,出货量超100万台,车内音效媲美百万豪车。视觉健康方面,AI黑板搭载圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽域显示确保教室全覆盖;AI学习机集成微纳米类纸屏技术,获得10余项国内外护眼认证。
多模态交互能力再升级,数字人导览“小飞”现场演示了八项核心技术突破,包括麦克风远场识别、3D视觉感知、多人主动交互等。其个性化记忆功能通过构建用户画像库,综合长期偏好、近期反馈和短期对话,实现精准推荐;百变声音复刻技术仅需1句录音即可复刻音色,并支持自定义风格生成。刘庆峰强调:“超拟人多模态交互将成为未来家庭AI标配,让技术更具情感温度。”
应用场景拓展方面,星火大模型在教育领域首创4000+标签错因体系,通过智能批阅机和教师助手实现“作业批改-课堂施教”小时级闭环,获国家数学课程标准修订组专家权威鉴定。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半。出行领域,星火智慧座舱2.0融合13个摄像头和54维记忆锚点,提供5项体征监测,打造“第三空间”。办公场景中,智能办公本X5和听见APP支持说话人识别自动生成会议纪要,手写与AI纪要深度融合。情感陪伴领域,“AI星朋友”凭借4.35MOS高保真声音克隆和160种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
生态建设方面,2025年科大讯飞AI开发者大赛吸引17国36,898个团队参与,涌现4,622个垂类智能体。截至10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会宣布全面开源原生支持RPA的智能体平台Astron,提供八大行业智能体,助力开发者跨越AI应用鸿沟。最后,科大讯飞携手多国伙伴启动“星火点亮全球”计划,依托多语言与自主可控技术,推动AI红利全球共享,为世界提供“第二种选择”。