Krisp VIVA开发工具包：革新语音智能体，提升对话精准与自然度-信息流-ITBear科技资讯

语音人工智能领域的佼佼者Krisp Technologies Inc.近日震撼发布VIVA，这是一款专为语音智能助手量身打造的语音隔离AI模型及SDK（软件开发工具包）。

据悉，VIVA已在全球范围内，每月处理超过10亿分钟的语音音频数据，展现了其强大的处理能力和广泛的应用潜力。

VIVA，全称为“Voice Intelligent Virtual Assistant Voice Isolation”，它无缝融入应用程序的音频流程中，极大地提升了语音智能助手识别语音活动的能力。这一创新不仅优化了对话轮换机制，有效避免了不必要的中断，还为用户带来了更加流畅、自然的对话体验。

随着消费者对AI语音交互需求的日益增长，传统的僵化、脚本化对话模式已难以满足现代需求。VIVA的推出，标志着语音智能助手正式迈入真实对话时代，它们能够动态响应并适应各种上下文环境，为用户带来前所未有的交互体验。

Krisp的联合创始人兼首席执行官Davit Baghdasaryan在接受专访时表示：“在对话中，我们称之为对话轮换。然而，当存在背景噪音时，对话轮换就会变得异常复杂。AI很容易因此感到困惑。”他进一步解释，对话轮换是指对话中的来回交流，即知道何时说话、何时倾听。而VIVA的出现，正是为了解决这一问题。

在语音AI领域，对话轮换涉及检测用户何时停止说话以及何时适合回应，以避免中断或长时间沉默。VIVA模型能够在20毫秒内处理音频，显著提高了响应速度，将对话轮换准确性提升3.5倍，从而大幅减少通话中断，提升客户满意度。

与依赖高耗能图形处理器的模型不同，VIVA在中央处理器上高效运行，这使得它能够在各种设备上广泛部署。无论是嵌入运行还是与更大模型并行工作，VIVA都不会影响整体性能，这对于企业而言无疑是一个巨大的优势。

VIVA不仅能够提高转录准确性，还能在嘈杂环境中消除不相关的音频，如背景电视声或无关对话，从而改善自动理解和整体用户体验。人类交流依赖于微妙的音频和行为线索，而VIVA正是通过识别这些线索，使语音智能助手更加智能、更加人性化。

Baghdasaryan强调：“仅从音频中，我们就能捕捉到五、六种不同的线索。如果我们要实现人类级别的对话AI，那么AI必须能够意识到这些线索。”他特别提到，笑声是一个常见的问题，但VIVA已经具备去除笑声的能力，从而避免机器人因此中断对话。

目前，VIVA已成功集成到Decagon AI、Voxex.ai、Vapi Inc.、Ultravox.ai（前身为Fixie.ai）、LiveKit Inc.以及多家全球顶级AI实验室的智能助手系统中，为用户带来了可感知的改进。

Vodex首席技术官Kumar Saurav对VIVA赞不绝口：“当我们的开发团队展示Krisp的能力时，我们深感震撼。看到我们的机器人在嘈杂的办公室环境中也能不间断地工作，这对我们来说是一个真正的游戏改变者。”

随着每月处理数十亿音频请求的里程碑达成，VIVA已蓄势待发，准备助力开发者构建更加响应迅速、智能的语音助手，为更好的客户支持和虚拟伙伴提供坚实基础。