近期,ChatGPT的Android应用程序迎来了一次重大更新,新增了一项备受瞩目的功能——语音模式下的实时字幕显示。用户只需轻触界面上的“更多”按钮,并选择“开启字幕”选项,即可在语音对话过程中同步查看对话内容的文字转录。这一创新不仅显著增强了应用的易用性,还为听力受限或在嘈杂环境中使用应用的用户带来了极大的便利。
据了解,字幕功能的实现依托于OpenAI先进的Whisper语音转文本技术,能够准确捕捉用户的语音输入以及ChatGPT的回复内容,并将其迅速转化为文字。用户在体验该功能后纷纷表示,字幕的清晰度和实时性都达到了令人满意的水平,为语音交互体验增添了更多的实用性和包容性。字幕内容还会在对话结束后自动保存到聊天记录中,便于用户随时查阅。
除了字幕功能外,此次更新还对ChatGPT的后台监听功能进行了优化。在语音模式下,用户可以让应用保持后台运行,即使暂时停止对话,ChatGPT也会持续监听用户的语音。当用户再次开口时,应用能够迅速响应并继续对话,无需重新激活语音模式。这一功能的改进使得语音交互更加流畅自然,特别适合在开车或处理多任务等需要间歇性交互的场景中使用。
随着AI语音助手市场的竞争日益激烈,ChatGPT此次的更新无疑为市场注入了新的活力。Google Gemini Live和Microsoft Copilot Voice等竞争对手也推出了类似的可视化交互改进,试图通过多模态功能吸引更多用户。然而,ChatGPT通过字幕和后台监听的优化,不仅提升了用户体验,还在可访问性和实时性方面树立了行业的新标杆。
自2023年11月向免费用户开放以来,ChatGPT移动端的语音模式已经吸引了数百万用户的青睐。对于Plus用户而言,他们还能享受到基于GPT-4o的高级语音功能,包括情绪感知和低延迟响应等。这些功能的推出不仅展示了ChatGPT在AI语音交互领域的领先地位,也为用户带来了更加智能、便捷的使用体验。