ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里通义百聆开源新模型:Fun-CosyVoice实现3秒音色克隆,Fun-ASR轻量化登场

时间:2025-12-15 23:49:23来源:互联网编辑:快讯

阿里旗下通义百聆团队近日在语音技术领域取得重要进展,正式开源两款轻量化语音模型。其中Fun-CosyVoice(0.5B版本)凭借其突破性的音色克隆能力引发关注,该模型仅需用户提供3秒语音样本,即可实现跨语言、跨方言的语音合成,同时支持情绪风格的动态调整。这项技术突破使得语音克隆不再受限于特定语种或表达方式,为个性化语音交互开辟了新路径。

在技术实现层面,Fun-CosyVoice通过创新的零样本学习框架,将传统语音克隆所需的庞大训练数据压缩至极简。开发者介绍称,该模型在保持高保真度的同时,将参数量控制在0.5B级别,显著降低了硬件部署门槛。更值得关注的是,模型支持完全本地化运行,用户无需依赖云端服务即可完成语音克隆与合成,这在隐私保护要求严格的场景中具有重要应用价值。

同步开源的Fun-ASR轻量化版本则聚焦语音识别优化,通过参数压缩技术将模型规模缩减至0.8B。测试数据显示,新版本在保持识别准确率的前提下,推理速度提升40%,硬件资源消耗降低65%。该模型同样支持本地部署与定制化微调,企业用户可根据特定场景需求,快速训练出行业专属的语音识别系统。

技术社区对这两款开源模型反响热烈。多位独立开发者在实测后表示,Fun-CosyVoice的跨语言能力突破了传统语音克隆的技术边界,其支持的方言种类超过20种,情绪表达维度达12类。而Fun-ASR的轻量化设计则解决了边缘设备部署的痛点,在智能车载、物联网设备等场景具有直接应用价值。目前两个项目已在开源平台完整公开代码与训练框架,配套提供详细的技术文档与开发指南。

更多热门内容
雷军直播拆小米YU7:电池测试严于新国标,安全设计贴心女性车主
IT之家 1 月 3 日消息,小米创办人,董事长兼 CEO 雷军今晚举行新年直播,现场直播工程师拆小米 YU7。 雷军在拆车过程中提到,小米YU7 在电池测试标准上比新国标更严苛;在安全气囊方面,他表示,小…

2026-01-04

小米汽车李田原:多彩配色源于用户个性需求,未来或超百款颜色可选
IT之家 1 月 3 日消息,小米创办人,董事长兼 CEO 雷军今晚举行新年直播,现场直播工程师拆车,拆一台新的小米 YU7。 在谈到小米SU7 和 YU7 的多彩配色时,雷军表示路上 90% 都是黑白灰,…

2026-01-04

雷军直面“小字”争议:行业陋习需整改,小米积极行动求完善
IT之家 1 月 3 日消息,小米创办人,董事长兼 CEO 雷军今晚举行新年直播,现场直播工程师拆车,拆一台新的小米 YU7。 在拆车后的问答环节,小米集团董事长特别助理、战略市场部副总经理徐洁云谈到了目前热…

2026-01-04

智元机器人艺人天团跨年炸场!唱跳走秀直播卖货样样行
上证报中国证券网讯(记者 孙小程)近日,智元推出首个“能文能武,唱跳全能”的机器人艺人天团登上京东《2025-2026 湖南卫视芒果TV跨年演唱会》,灵犀X2、远征A2、精灵G2、四足机器人D1的全能表现…

2026-01-04

苹果手机日本上网全攻略:选卡避坑+设置教程+实测推荐
•• eSIM兼容性问题:部分老款iPhone不支持eSIM,只能插物理卡 ••网络频段差异:日本运营商使用的频段可能与国行iPhone不兼容 •• APN自动配置:有些廉价流量卡需要手动设置APN,但…

2026-01-04