ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

捷通华声灵云语音识别重大突破 中文语音识别行业领先

时间:2018-09-17 11:45:12来源:互联网编辑:星辉

近期,捷通华声应用最新算法,推出全新一代灵云语音识别核心引擎,识别率实现跨越式提升。目前,新一代语音识别技术已上线灵云平台(AIcloud.com),供开发者调用,并面向政企客户推出包含8k、16k版本的全新灵云语音识别能力平台。

新一代灵云语音识别演示(建议全屏观看)

此次灵云语音识别技术的升级,是捷通华声在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化。有效提升了语音识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率。

调用云端语音识别服务 就上灵云平台

新一代灵云语音识别技术已上线灵云平台,开发者可以去灵云开发者社区(aicloud.com/dev/)申请调用。

开发者将灵云语音识别SDK集成到ISO、JAVA、安卓、Windows等软件应用中后,填写申请到的灵云平台语音识别服务地址、授权信息,便可免费调用灵云平台的语音识别服务。

目前,灵云平台上的语音识别技术已服务包括打车软件、输入法、翻译APP、手机银行客户端等各类数十万应用,覆盖数亿终端用户。

灵云ASR能力平台 为政企单位提供私有、专业的语音识别能力

在提供公有云ASR能力的同时,捷通华声一直在为Callcenter、会议、公安等场景提供私有化的语音识别能力。

其中,在Callcenter 电话信道8K语音识别场景,捷通华声已服务众多大型银行客服中心、客服BPO中心,将海量语音实时转写为文字,为智能质检、智能客服、智能外呼、数据分析等提供私有云的语音识别能力。

在会议、司法、医疗等16k语音识别场景,捷通华声积累了大量声学、语言数据,分别推出了会议、审讯、医疗各科室等行业版的语音识别能力平台,为政企客户提供专业、私有、更安全的语音识别能力。

十多年来,捷通华声始终坚持核心技术自主研发。随着此次灵云语音识别技术的跨越式提升,捷通华声将为公有云开发者、政企客户提供识别率更高、更优质的语音识别能力与服务。

更多热门内容
万家臻选混合C最新净值公布,近一周涨1.81%,重仓科技股表现抢眼
金融界2025年8月3日消息,万家臻选混合C(022709)最新净值3.0121元,该基金近一周收益率1.81%,近3个月收益率19.18%,今年来收益率6.17%。 万家臻选混合C基金成立于2024年11…

2025-08-04