从AI语音玩具到对话式AI爆发：实时交互技术开启下一个万亿级市场-人工智能-ITBear科技资讯

一段小女孩与AI玩具深情告别的视频在网络上迅速走红，引发了人们对人机情感交互的广泛关注。视频中，小女孩对一个具有语音功能的AI玩具依依不舍，这场跨越人与机器的离别，展现了对话式AI正在悄然融入人类情感世界的现实。

当前，许多AI交互仍停留在"短信"时代，用户通过输入框提出问题，AI以文字形式回复。然而，人类沟通中，语言内容仅占7%的信息量，声音传递占38%，表情等身体语言则高达55%。这一"梅拉宾法则"揭示了多模态交互的重要性。正如智能手机不仅依赖通信功能，更需要触控屏和传感器的突破，AI交互领域同样需要技术革新。

多模态大模型的发展正在推动AI从"生成"向"交互"演进。实时交互能力的普及成为下一个关键方向，计算机通过多模态LLM技术实现了类人的实时语音对话能力。这种突破使得"具有活人感"的对话式AI开始爆发，2024年因此被视为智能体和对话式AI的元年。

10月31日，声网与RTE开发者社区联合主办的Convo AI&RTE 2025大会在上海召开。这场第十一届实时互联网大会吸引了众多开发者参与，现场座无虚席。大会覆盖了实时互联网和对话式AI全生态，推出20余场论坛及周边活动，涵盖技术开发、趋势洞见、行业观察、创业投资等多个维度。

自2015年声网将RTC开发者大会引入中国以来，这场年度盛会已连续举办十余届。从最初的WebRTC/RTC底层技术交流，到2020年升级为"RTE实时互联网大会"，议题扩展至"实时互动"的广阔场景。如今，大会已成长为全球规模最大的实时互联网盛会，累计覆盖200多个行业场景，影响超过200万开发者。

声网CEO赵斌在大会上指出，对话式AI正在经历从"正常对话"到"声情并茂"的关键转变。2024年第三季度，声网的对话式AI用量环比增长151%，年度服务分钟数首次突破1万亿。ElevenLabs黑客松在短时间内孵化了300多个创业项目，开源的TEN framework和TEN Agent多次登顶GitHub排行榜。

全球科技巨头纷纷布局对话式AI领域，相关创业公司呈现爆发式增长。方舟投资的报告显示，AI陪伴赛道可能从3000万美元增长至700-1500亿美元，增长潜力高达5000倍。这种增长不仅体现在市场规模上，更反映在应用量和活跃度的持续提升中。

在应用场景方面，情感陪伴、智能硬件和在线教育将率先实现对话式AI的规模化落地。声网推出的对话式AI开发套件R1-4G，基于紫光展锐8910高性能AI芯片，融合4G通信功能，帮助开发者快速集成硬件对话能力。该套件优化了音视频通话与4G适配，实现650ms延迟和340ms打断响应。

对话式AI模型评测平台3.0新增了价格预估计算器功能。开发者可以根据实际业务需求预设人机对话比例，平台将自动计算总价和各模块单价，帮助开发者更好地控制成本。这一工具解决了行业面临的低延迟响应、自然打断、上下文管理等技术难题。

在实时交互与场景理解方面，对话式AI已取得突破性进展。高拟人度实时翻译在特定场景实现实用化，车载智能助理提升驾驶体验，AI辅助生活拓展残障人士的边界。这些应用表明，AI实时交互正在创造巨大的市场机会。

OpenAI去年5月推出的GPT-4o语音-视觉-文本实时多模态技术，成为行业新共识。随后推出的Realtime API公测，使声网等首批集成伙伴能够将低时延语音对话能力带入实际应用。在国内，声网与MiniMax、智谱等企业合作，推动了语音对话技术的秒响应和自然交互。

随着RTE成为AI对话的基础设施，音视频对话正在成为智能应用的标配。终端设备如耳机、手机和家居产品不断增强硬件加速能力，使"开口-回应-执行"的链路更加可用。虽然全新交互形态的硬件可能不会很快出现，但对话式AI引入硬件形态将带来未来两年的爆发式增长。

王兴兴谈具身智能：ChatGPT时刻待临，人形机器人能力将迎新标配

宇树科技股份有限公司创始人、董事长王兴兴在论坛期间表示，具身机器人当下及未来最关键的核心要素是机器人大模型，目前的发展阶段类似于ChatGPT发布前的1—3年左右。王兴兴还谈到了目前具身智能的两种主流模型…

2025-11-06

苹果拟10亿美元引入谷歌AI，1.2万亿参数模型或成Siri升级关键助力

据报道，根据协议安排，谷歌的Gemini模型将处理Siri的信息摘要和任务规划功能，这些组件帮助语音助手综合信息并决定如何执行复杂任务。据媒体援引知情人士透露，尽管公司正在流失AI人才，包括模型团队负责人…

2025-11-06

聚焦数字治理新需求互联网法院管辖范围优化升级引关注

之所以作“减法”，是基于互联网法院的探索、示范和各级法院的共同努力，相关案件的裁判规则已经形成，法院的审判能力已经全面提升，体现了对互联网法院建设成效的充分肯定；之所以作“加法”，将数据权益、算法治理、人工…

2025-11-06

苹果拟借谷歌1.2万亿参数AI模型推动Siri明年焕新升级

据知情人士透露，苹果公司计划使用谷歌开发的一款拥有1.2万亿参数的人工智能模型，来助力其长期承诺的Siri语音助手全面升级。苹果曾考虑使用其他第三方模型执行此任务，但在测试了Gemini、OpenAI的C…

2025-11-06

三协电机：以研发为基、赛道为翼、出海为帆，开启价值新篇章

2025-11-06

晶泰科技与礼来再携手！Ailux平台助力双抗研发，协议最高达3.45亿美元

2025-11-06

57岁科技老将胡玮履新华泰保险总经理，外资控股下能否引领新气象？

2025-11-06

国产功率半导体双雄崛起：借新能源车东风，逆势增长展实力

2025-11-06

27万小时真实数据支撑，GEN-0模型揭示机器人智能扩展新规律

2025-11-06

银河通用联合多团队推出NavFoM：跨本体全域环视导航基座大模型问世

2025-11-06