ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里云AI语音输入法「CosyVoice」上线:功能多元

时间:2026-06-25 11:18:18来源:互联网编辑:快讯

阿里云近日正式推出基于千问大模型的智能语音输入法“CosyVoice”,这款以语音交互为核心的产品同时支持macOS和移动端应用商店下载,目前采用限时免费策略,未来可能推出付费服务。作为一款突破传统输入框架的工具,其核心功能覆盖多语种实时转写、方言识别及指令意图解析,通过AI技术重构了语音到文字的转换流程。

在基础操作层面,用户需在电脑端完成麦克风、录屏等权限设置后,通过预设的“Fn”快捷键即可启动语音输入。系统支持中英文混合识别,当用户说出“你好,这里是读佳”时,语音结束键按下后文字会自动填充至输入框。测试中发现,该工具对“读佳”等专有名词存在误识别为“独家”的情况,需通过手动修正或后续版本优化解决。

针对专业场景需求,产品开发了热词Skill功能模块。用户可手动导入行业术语、品牌名称等自定义词汇,系统在转写时会优先匹配这些高频词库。这项功能对自媒体从业者、科研人员等群体尤为重要,可显著减少因同音词导致的二次编辑工作量。

在内容处理维度,CosyVoice展现出多项差异化能力。其智能净化系统可自动过滤“嗯”“啊”等口语填充词,对重复表述进行智能合并;结构化整理功能支持将分点陈述、数据对比等复杂内容自动转化为编号列表或表格;口语修正识别模块能捕捉“不对”“改成”等修正指令,确保最终文稿的逻辑连贯性。

针对特定场景需求,该工具开发了制式文稿生成功能。用户通过语音指令即可完成邮件、会议邀请、Vlog脚本等标准化文档的创作,系统会自动添加称谓、落款等格式要素。在数字处理方面,其智能转换引擎可将“三点五八亿”等口语化表述转化为规范数字格式,并支持基础数学公式的符号补全。

方言支持是该产品的另一技术亮点。实测显示,系统可准确识别上海话、粤语、四川话等主流方言,并实时转写为标准普通话文本。这项功能在区域媒体采访、跨地域协作等场景中具有实用价值,有效降低了方言沟通的数字化门槛。

移动端应用延续了核心功能矩阵,但操作逻辑更适配触屏设备。用户通过系统设置启用后,在任意输入框点击麦克风图标即可启动录音,转写过程中可通过撤销键修正内容,切换按钮可快速返回传统输入模式。这种双模式设计兼顾了语音输入的效率优势与传统打字的精准控制。

数据统计模块为用户提供了可视化使用报告,首页面板实时更新累计输入时长、总字数、平均语速等关键指标,并计算语音输入相较于手动打字的效率提升值。这些数据不仅帮助用户优化使用习惯,也为产品迭代提供了量化依据。

从技术架构看,千问大模型为产品提供了多模态理解能力,使其在复杂语境下的语义解析准确率显著提升。当前版本虽在专有名词识别上存在优化空间,但通过热词库的持续更新和模型训练,系统正在逐步完善对细分领域的覆盖能力。这种“基础功能免费+专业服务增值”的商业模式,或将重新定义语音输入工具的市场竞争格局。

更多热门内容
珞石机器人过聆讯冲刺港股,全产品线布局占先机,短板待补引关注
客户结构层面,其机器人产品业务的客户规模与稳定性仍有明显提升空间:招股书数据显示,2023-2025年该业务客户数量虽然增长亮眼,但客户留存率在2025年仅32.5%,波动明显且处于较低水平;尽管净收入客户…

2026-06-25

vivo TWS 5 Pro圈铁架构搭配独立DAC,旗舰级音质与降噪带来沉浸体验
导览为全面了解该耳机的实际表现,我爱音频网对vivo TWS 5 Pro进行了详细的测试与体验,主要为使用体验、数据实测、外观设计。连接距离测试vivo TWS 5 Pro支持蓝牙5.4以及Wi-Fi 5…

2026-06-25

5G专利大比拼:华为中兴领跑全球,国产5G技术话语权稳稳站住脚跟
此前一直有舆论质疑,我国虽是5G专利大国,每年却是专利费净支出国家,每年付给海外企业的专利费,远高于收到的海外专利费,网友纷纷吐槽国产专利只重数量、质量落后,全是无效专利。 中国是全球手机、通信基站制造第一…

2026-06-25

道和服务器机箱:1U选型全攻略,数据中心与云计算场景适配方案推荐
建议采购方从生产规模、定制能力、行业适配经验及****体系等客观指标综合评估,优先选择具备全链条服务能力与全球化交付经验的厂商。 基于上述调研信息,广州市宝承电子科技有限公司在精密制造、定制化响应及行业适配经…

2026-06-25

新石器无人车追尾被判全责
近日,山东青岛发生的一起新石器无人送货车追尾特斯拉事故,引发网友广泛关注。事故不仅造成三车受损、车主受伤,也让无人配送车的责任认定和保险保障问题再次成为讨论焦点。据了解,事故发生于6月22日下午4时30分左右。特斯拉车主李先生驾驶车辆在青岛黄岛区隐珠街道灵

2026-06-25

OpenAI携手Broadcom推出推理芯片Jalapeño,能否打破英伟达垄断?
但 OpenAI 把这件事作为正式发布的一部分拿出来说,意思很明确:这既是一块推理芯片的发布,也是一次「AI 设计 AI 基础设施」的自我证明。从买英伟达的卡,到和 Broadcom 联手造自己的芯片,Op…

2026-06-25

阿里云上线CosyVoice输入法
今日,阿里云上线AI语音输入法“CosyVoice输入法”,移动端版本现已登陆各安卓品牌手机应用商店、苹果AppStore,用户可直接搜索CosyVoice下载体验,Mac版也已可从官方网站下载,Windows版显示敬请期待。官方网址:https://qwentype.com/

2026-06-25

小米YU7 GT自动驾驶创佳绩:浙赛首纪录+纽北新分类,第一视角公开
IT之家 6 月 24 日消息,小米汽车今日宣布,小米 YU7 GT 创造了浙赛首个自动驾驶圈速纪录,用时 1:49.434。 另外,小米YU7 GT 本周还达成了全球首个纽北自动驾驶圈速纪录,用时 10 …

2026-06-25

中国00后团队打造3D大模型Hyper3D,获数亿融资,英伟达等大厂已接入
但在国内有一家做 AI 3D 生成的年轻公司影眸科技,其 CEO 吴迪对「会不会做世界模型」的回答,反而有点克制。 新的 AI 3D 生成模型Rodin Gen-2.5 是全球首个具备千万面级生成能力的 …

2026-06-25

2026年4K Live实况手机大比拼!荣耀600系列领衔,影像续航双突破
在这场盘点中,荣耀600系列凭借2亿AI超清主摄与5000万像素潜望长焦镜头等核心影像参数,在画质与动态捕捉上实现了突破,完美契合了的主题,为用户带来了前所未有的实况拍摄体验,重塑了中端档位旗舰体验新标杆。 …

2026-06-25