ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

Krisp VIVA开发工具包:革新语音智能体,提升对话精准与自然度

时间:2025-07-18 02:58:27来源:至顶头条编辑:快讯团队

语音人工智能领域的佼佼者Krisp Technologies Inc.近日震撼发布VIVA,这是一款专为语音智能助手量身打造的语音隔离AI模型及SDK(软件开发工具包)。

据悉,VIVA已在全球范围内,每月处理超过10亿分钟的语音音频数据,展现了其强大的处理能力和广泛的应用潜力。

VIVA,全称为“Voice Intelligent Virtual Assistant Voice Isolation”,它无缝融入应用程序的音频流程中,极大地提升了语音智能助手识别语音活动的能力。这一创新不仅优化了对话轮换机制,有效避免了不必要的中断,还为用户带来了更加流畅、自然的对话体验。

随着消费者对AI语音交互需求的日益增长,传统的僵化、脚本化对话模式已难以满足现代需求。VIVA的推出,标志着语音智能助手正式迈入真实对话时代,它们能够动态响应并适应各种上下文环境,为用户带来前所未有的交互体验。

Krisp的联合创始人兼首席执行官Davit Baghdasaryan在接受专访时表示:“在对话中,我们称之为对话轮换。然而,当存在背景噪音时,对话轮换就会变得异常复杂。AI很容易因此感到困惑。”他进一步解释,对话轮换是指对话中的来回交流,即知道何时说话、何时倾听。而VIVA的出现,正是为了解决这一问题。

在语音AI领域,对话轮换涉及检测用户何时停止说话以及何时适合回应,以避免中断或长时间沉默。VIVA模型能够在20毫秒内处理音频,显著提高了响应速度,将对话轮换准确性提升3.5倍,从而大幅减少通话中断,提升客户满意度。

与依赖高耗能图形处理器的模型不同,VIVA在中央处理器上高效运行,这使得它能够在各种设备上广泛部署。无论是嵌入运行还是与更大模型并行工作,VIVA都不会影响整体性能,这对于企业而言无疑是一个巨大的优势。

VIVA不仅能够提高转录准确性,还能在嘈杂环境中消除不相关的音频,如背景电视声或无关对话,从而改善自动理解和整体用户体验。人类交流依赖于微妙的音频和行为线索,而VIVA正是通过识别这些线索,使语音智能助手更加智能、更加人性化。

Baghdasaryan强调:“仅从音频中,我们就能捕捉到五、六种不同的线索。如果我们要实现人类级别的对话AI,那么AI必须能够意识到这些线索。”他特别提到,笑声是一个常见的问题,但VIVA已经具备去除笑声的能力,从而避免机器人因此中断对话。

目前,VIVA已成功集成到Decagon AI、Voxex.ai、Vapi Inc.、Ultravox.ai(前身为Fixie.ai)、LiveKit Inc.以及多家全球顶级AI实验室的智能助手系统中,为用户带来了可感知的改进。

Vodex首席技术官Kumar Saurav对VIVA赞不绝口:“当我们的开发团队展示Krisp的能力时,我们深感震撼。看到我们的机器人在嘈杂的办公室环境中也能不间断地工作,这对我们来说是一个真正的游戏改变者。”

随着每月处理数十亿音频请求的里程碑达成,VIVA已蓄势待发,准备助力开发者构建更加响应迅速、智能的语音助手,为更好的客户支持和虚拟伙伴提供坚实基础。

更多热门内容