ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

小米发布全链路语音大模型 MiMo-V2.5,TTS 可“一句话生成新音色”,ASR 开源支持方言与多语混说

时间:2026-04-24 11:45:58来源:CHINAZ编辑:快讯

当 AI 语音不再只是“能听会说”,而是能像导演一样精准调度情绪、语气甚至角色身份,人机交互的自然度正迈入新纪元。小米今日正式推出MiMo-V2.5全链路语音模型系列,包含三款 TTS(语音合成)模型与一款开源 ASR(语音识别)模型,全面覆盖 Agent 时代的语音输入与输出需求,让声音真正成为可编程、可创作、可复刻的智能媒介。

更多热门内容