在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为核心主题,正式推出讯飞星火大模型最新技术升级及系列创新产品,同时系统梳理了AI产业红利落地的具体路径。科大讯飞董事长刘庆峰在发布会上强调,AI技术要实现规模化应用,需突破自主可控、软硬融合、行业深耕与个性化服务四大核心挑战。目前,这一战略已取得阶段性成果:通过与头部企业联合开发的300余个“开箱即用”智能体中,已涌现出多个具备行业标杆意义的“AI员工”。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。

本次发布会的重头戏之一是深度推理大模型讯飞星火X1.5的亮相。该模型采用混合专家(MoE)架构,总参数量达2930亿、激活参数量300亿,推理效率较前代提升100%。其语言理解、文本生成、逻辑推理等六大核心能力全面对标国际主流,数学能力持续保持领先,多语言支持覆盖130余个语种,整体性能达到GPT-5的95%以上,在拉美、东盟等14个重点语言场景中表现尤为突出。更值得关注的是,星火X1.5在国产算力平台上攻克了两项关键技术:长思维链强化学习训练效率从30%提升至84%,MoE模型全链路训练效率实现质的飞跃,为自主可控的AI发展奠定了坚实基础。科大讯飞全球首发的非自回归语音大模型架构,通过并行输出文本序列,在保持效果提升16%的同时,将推理成本降低520%。
软硬一体化解决方案的推出,标志着AI技术向真实场景的深度渗透。科大讯飞发布的软硬件融合方案整合了AI与麦克风阵列、扬声器阵列、摄像头阵列及视觉呈现技术。例如,讯飞智能办公本X5搭载上4下4环八麦克风阵列,在强噪音环境下识别准确率达95.08%,远超iPhone 17 Pro;AI翻译耳机采用单耳三麦多感融合降噪系统,复杂噪声下识别率高达97.1%;双屏翻译机2.0的强降噪模式在90dB噪音中仍能保持98.69%的识别率。在扬声器领域,iFLYSOUND智能座舱音响方案通过立体空间声场重构技术,已在19家车企量产,累计出货超100万台,车内音效媲美百万级豪车。视觉健康方面,讯飞AI黑板配备全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽域显示确保教室全员清晰观看;AI学习机则集成微纳米类纸屏等技术,获得国内外10余项护眼认证。
多模态交互能力的突破为AI赋予了更人性化的特质。发布会现场,数字人导览“小飞”展示了其跨模态交互实力:支持多人多语种对话、基于历史数据的个性化推荐,并能完成购票、订酒店等复杂任务。这一体验背后,是讯飞在麦克风远场识别、3D视觉感知、视听觉融合理解等八项技术上的创新。其中,个性化记忆能力通过构建用户画像库,实现对长期偏好、近期反馈与短期对话的综合理解;百变声音复刻技术则基于星火语音大模型,仅需1秒录音即可复刻任意音色,并支持风格化声音创造。刘庆峰指出,这些技术使AI从工具升级为具备情感深度的伙伴。

在应用场景拓展方面,科大讯飞展示了AI在教育、医疗、汽车、办公及情感陪伴领域的深度实践。教育领域,星火大模型构建的错因体系包含3大类、3层级、4000余标签,通过智能批阅机与教师助手实现“作业批改-课堂施教”小时级闭环,获国家数学课程标准修订组专家权威认证。医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,病历书写时间减半;“智医助理医院版1.0”与个人健康助手“讯飞晓医”进一步扩大服务覆盖。出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供个性化偏好记忆与5项体征监测,重塑汽车作为“第三空间”的定位。办公场景中,智能办公本X5与听见APP升级自动生成会议纪要功能,手写记录与AI纪要深度融合;情感陪伴领域,“AI星朋友”凭借高保真声音克隆与160余种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
为构建开放生态,科大讯飞启动“星火点亮全球”计划,并发布原生支持RPA的智能体平台Astron。该平台将AI大脑与自动化执行手脚结合,提供八大行业智能体,助力开发者跨越应用鸿沟。数据显示,2025年AI开发者大赛吸引17国3.6万个团队参与,涌现4622个垂类智能体;讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。刘庆峰表示:“AI不仅是技术革命,更应成为赋能每个人、温暖世界的力量。通过全球合作,我们将为世界提供AI发展的多元选择。”

