ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阿里推出会议AI助理“听悟”,可秒速生成智能会议纪要

时间:2021-10-22 17:44:17来源:互联网编辑:星辉

10月21日,杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。相比只能逐字转写的上一代语音产品,“听悟”是面向未来会议的AI助理,集成了达摩院最新语音及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。

会议场景对语音转文字产品有强需求。但因技术限制,传统语音产品存在“听不准、分不清、看不懂”等问题,往往在噪音下识别准确率较低,无法区分不同说话人,转写内容冗长难以阅读和沉淀。针对痛点,达摩院语音实验室打造了“听悟”,通过让AI深度参与,让线上及线下会议更智能、高效、协同。

“听悟”内置达摩院独创声纹融合方位算法,能对多达10位说话人进行角色分离;融入达摩院新一代端到端语音识别模型,中文识别准确率可达98%,支持14种方言及中英文“自由说”;可嵌入线上音视频会议,实时出字幕及纪要。

除了听力好,这位AI助理悟性也高。 “听悟”能模仿人工整理,进行智能纠错和分段,自动过滤语气词,让生成文本更流畅。同时,“听悟”擅长抓重点,可秒速生成关键词、核心结论、重点内容和待办,用户能同屏编辑、标注摘要、一键分享、安全保存。“听悟”还能对常用词、用户行为及历史文档进行自学习,越用越聪明。

此外,“听悟”配置了智能麦克风,融入达摩院指向性差分麦克风阵列技术,可实现7米内远距离360度高清收音,相比传统麦克风收音距离、抗噪能力大为提升。

达摩院语音实验室负责人鄢志杰表示,“语音技术的发展是不断解锁场景的历史,会议作为当下组织协同的核心场景,是语音AI将变革的下一个重要场景。”

鄢志杰介绍,“听悟”适用于企业会议、金融调研、媒体访谈、教育培训等泛会议场景,目前面向企业客户,已为多家头部金融企业提供服务,且应用于钉钉新上线的“钉闪记”功能中。未来,“听悟”还将探索与会议厂商合作。

IDC报告显示,阿里AI近年在语音语义领域表现强劲,市场年增长率达96.6%,增速第一,总营收中国前二,已深入政务、金融、电商、法律等行业,应用于会议、客服、IoT、搜索、文本分析等场景。

更多热门内容
十年磨一镜:Rokid以全栈自研开启AR眼镜全球征程
今年初的一次演讲上,杭州灵伴科技有限公司(Rokid)创始人兼首席执行官祝铭明戴着智能眼镜上台发言,在大会现场刮起一阵潮流新风。看似普通的眼镜,可以实时提词、拍照、录音、导航……这款主打增强现实(AR)+人工…

2025-10-14

2025年智能体技术蓬勃发展,从概念到应用及风险治理全解析
负责接收外部环境的信息和用户指令,是智能体与外界交互的“窗口”,为后续的分析和决策提供原始数据; 作为智能体的核心处理组件,对感知组件获取的信息进行分析和理解,结合记忆组件中的数据做出决策,并向动作组件发出…

2025-10-14

四川首批元宇宙工业研学点发布!解锁科技前沿新玩法
四川物通科技集团有限公司是一家专注于AI+XR融合技术的创新型科技企业,在物通科技打造的界坐标・元宇宙数智实验工场,体验者不仅可以“登上”虚实结合的雪山,“走进”300公里以外的白酒生产车间,还可以通过语音…

2025-10-14

CFCA数字证书加持智能眼镜支付,筑牢安全防线开启便捷支付新篇
在智能眼镜支付场景中,这意味着证书管理可在后台无感知地完成产生、更新与验证等操作,从而让用户体验更顺畅,让系统更安全。 未来,CFCA将继续以数字证书为核心的“信任底座”,为未来智能眼镜、AR/VR、可穿戴设…

2025-10-14