ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里通义开源Fun-CosyVoice3-0.5B 提供零样本音色克隆能力

时间:2025-12-16 00:17:59来源:凤凰网科技编辑:快讯

凤凰网科技讯 12月15日,阿里通义宣布开源Fun-CosyVoice3-0.5B,该版本提供了zero-shot(注:零样本)音色克隆能力,只需要你提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。

通义推出轻量化版本Fun-ASR-Nano模型,总参数量压缩到0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。

值得一提的是,通义还增强了Fun-ASR模型,噪声场景准确率93%、支持歌词与说唱识别。

更多热门内容
DeepSeek新动态:V4大模型春节前后登场 编程能力升级且架构创新
【太平洋科技】1 月 10 日消息,据外媒 The Information 昨日报道,DeepSeek将在未来几周时间内发布新一代旗舰大模型,将具备更强的编程能力。 知情人士透露,这款模型代号 V4,是…

2026-01-10

DeepSeek V4大模型或春节前后亮相 编程能力升级 架构创新引关注
【太平洋科技】1 月 10 日消息,据外媒 The Information 昨日报道,DeepSeek将在未来几周时间内发布新一代旗舰大模型,将具备更强的编程能力。 知情人士透露,这款模型代号 V4,是…

2026-01-10