ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

小米发布MiMo-V2.5-TTS/ASR语音大模型

时间:2026-04-24 12:06:43来源:凤凰网科技编辑:快讯

凤凰网科技讯 4月24日,继前一日MiMo-V2.5系列大模型公测后,小米技术团队今日再次加码,正式发布MiMo-V2.5-TTS系列与MiMo-V2.5-ASR,补齐语音输入与输出全链路。

其中,TTS系列包含三款模型,均支持通过自然语言指令精细调度声音表现。MiMo-V2.5-TTS:内置多款精品音色,开箱即用,支持语速、情绪控制。MiMo-V2.5-TTS-VoiceDesign:支持一句话从零生成全新音色,无需参考音频。MiMo-V2.5-TTS-VoiceClone:数秒参考音频即可高保真复刻目标音色,并保留原有风格指令控制能力。官方演示显示,模型能遵循“尖锐刻薄、狐假虎威”等复杂指令,并支持在文本中插入音频标签进行精细化控制。

作为听觉基座,MiMo-V2.5-ASR今日正式开源(包括模型权重与代码)。该模型面向复杂真实场景,支持吴语、粤语等中文方言,以及中英文混说、强噪音、多人对话等场景,并原生输出标点符号,转写结果即拿即用。

目前,TTS系列已在MiMo Studio开放快速体验,ASR代码与权重可在GitHub和HuggingFace获取。小米预告,下一步将向通用音频生成(音效、音乐)及更强的上下文理解能力扩展。

更多热门内容
小米汽车V8s EVO超级电机揭秘:28000rpm高转速,引领电动新速度
小米 V8s EVO 超级电机还搭载自研碳化硅功率模块,全电压范围都可以输出 800A 有效电流,电控峰值功率密度达到120kW/L,功率提升了 5.9%。 IT之家注意到,小米 YU7 GT 还采用双电…

2026-05-29

2026世界智能产业博览会聚焦:具身智能“进厂” 算力筑基 天津成AI实干核心地
在5月28日举行的2026年世界智能产业博览会现场,王兴兴说道,“如果未来几年具身智能的技术真正突破,机器人真正在家庭和工厂干活的时候,我们既然能做一点几米高的机器人,我们当然能做七米甚至十几米高的机器。”…

2026-05-29

小米YU7 GT eLSD电子差速锁:多场景适配,安全操控双提升的秘密
eLSD日常使用场景分析经济/舒适/运动模式:eLSD稳定,城区代步几乎无感,通勤轻松。跑山/弯道超车:自定义模式下,eLSD调至中性,车身更灵活,操控提升。赛道模式:配合赛道大师APP,eLSD可0-3挡调…

2026-05-29