在2025腾讯云AI产业应用峰会上,腾讯云智能领域的领军人物吴运声,以其独特的视角,深入剖析了当前AI应用的最新趋势。他强调,AI应用正朝着交互体验更丰富、模型使用更高效以及应用构建更快捷的方向发展。为了满足市场的新需求,腾讯云在多模态语音交互、模型训练与推理、以及智能体开发等多个层面,不断推陈出新,助力企业加速技术创新向实际生产力的转化。
在提升用户与AI应用交互体验方面,腾讯云推出了“腾讯云语音PaaS解决方案”。该方案将先进的ASR(自动语音识别)大模型、TTS(文本转语音)大模型与TRTC(腾讯实时音视频通信)技术深度融合,构建了一条从“语音输入”到“智能处理”,再到“自然输出”和“实时交互”的全链路闭环。这一解决方案不仅成本低廉,而且能够快速搭建,为企业提供了优化用户交互体验的新途径。
吴运声指出,腾讯云在模型训练与推理层面也取得了显著进展。腾讯云TI平台全面升级,不仅提供了包括蒸馏精调、强化学习在内的多种训练方式,还针对自动驾驶领域推出了专属的模型训练能力。在资源调度方面,TI平台实现了训推一体和潮汐调度,大幅提升了资源利用率。同时,通过内置的Angel加速套件,TI平台在推理加速方面达到了业界领先水平,有效降低了企业的成本。
吴运声还提到,随着大模型到智能体的演进,AI应用正步入“平权时代”。智能体的广泛应用将成为企业创新提效的重要工具。为此,腾讯云将大模型知识引擎升级为腾讯云智能体开发平台。该平台凭借行业领先的RAG技术、全面的Agent能力以及实战中打磨出的功能,帮助用户在大模型时代快速构建智能体。这些智能体不仅能够理解企业知识,还能灵活调用工具,自主执行复杂任务。
经过多个真实业务场景的验证,腾讯云智能体开发平台展现出了强大的核心能力。它不仅“能用”,而且能够贴合企业复杂业务,实现可落地、可运营,满足企业的全链路需求。例如,QQ浏览器利用腾讯云智能体开发平台,推出了智能体Qbot,通过AI助手帮助用户执行下载、应用更新等任务,极大地提升了用户体验。
在演讲中,吴运声还分享了腾讯云在语音识别、输出和实时传输等方面的优化成果。ASR大模型在远场、噪音等复杂场景下的字错率明显下降,支持方言识别,并能动态适应不同口音、不同语速。TTS大模型则在拟人度、韵律自然度上显著提升,发音接近真人自然对话感。同时,TRTC的超低延迟通信确保了全球范围内音视频传输的流畅性,让用户享受到近似人类自然对话的互动体验。
腾讯云在AI领域的持续创新和深耕细作,不仅推动了AI技术的快速发展,更为企业提供了更加高效、便捷、智能的解决方案。随着AI技术的不断成熟和应用场景的不断拓展,腾讯云将继续引领AI产业的变革和发展。