ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

字节跳动Seeduplex大模型上线豆包App,语音交互更自然流畅贴近真人节奏

时间:2026-04-09 23:37:34来源:快讯编辑:快讯

字节跳动近日正式发布全新原生全双工语音大模型Seeduplex,这款基于“边听边说”架构设计的模型,标志着语音交互技术向更自然的方向迈出关键一步。相较于传统半双工语音系统需要等待用户完整表达后再回应的“回合制”模式,Seeduplex实现了实时倾听、内容生成与节奏判断的同步进行,显著提升了对话的流畅度与真实感。

技术测试数据显示,在咖啡厅等复杂声学环境中,Seeduplex通过多维度声学分析技术,可精准分离用户语音与背景噪音。与前代半双工模型相比,其误回复率与误打断率均降低50%,即便在多人交谈或设备移动产生的干扰下,仍能保持稳定识别。当用户出现思考停顿或临时中断对话时,模型通过融合语音停顿时长、音调变化及语义完整性等特征,将抢话现象减少40%,判停延迟缩短至250毫秒以内,使交互节奏更贴近人类对话习惯。

该模型在上下文理解能力上亦有突破性表现。在飞花令、模拟面试等需要连续记忆的场景中,Seeduplex可基于部分语义信息提前预判用户意图,实现“未说完先回应”的智能交互。第三方评估机构使用MOS(平均意见分)体系测评显示,其对话流畅度得分较传统模型提升12%,尤其在多轮复杂对话中,能动态维护长达20轮以上的上下文记忆链。

目前Seeduplex已通过豆包App向全体用户开放服务。字节跳动语音技术团队透露,未来将持续优化模型在方言识别、情感表达等维度的性能,并探索车载语音助手、智能客服等场景的深度应用。值得注意的是,尽管技术进步显著,语音交互领域仍存在数据隐私、伦理规范等挑战,相关技术落地需兼顾创新与合规。

更多热门内容
北京智源领航世界模型新赛道 中国AI竞逐万亿级物理交互新蓝海
王仲远举了个例子,视频模型能生成天上飞的猪,这在数字世界是趣味,在物理世界却是灾难。 王仲远提出,要让AI真正进入物理世界,解决制造业、医疗、物流、养老等实体经济的痛点,世界模型须具备几项核心能力——物理正确…

2026-06-13

谷歌推出Gemini-SQL2模型:Text-to-SQL能力顶尖,执行准确率达80.04%
IT之家注:Text-to-SQL 是指把自然语言问题自动转换成 SQL查询的技术。用户不必手写数据库语句,只需用口语描述需求,系统就尝试生成可运行的 SQL。 在实际场景下,业务人员可以通过该模型自助式…

2026-06-13

HDC2026新看点:鸿蒙智能体框架升级,小艺如何实现能力跃迁与智慧进化?
HDC2026上,小艺给出了答案,能跨应用执行、具备持久记忆与自主决策能力的智能协同。鸿蒙系统应用全面Skill化,把备忘录、日历、图库等2100多项系统能力开放给小艺,同时日程、位置、健康指标、睡眠数据、…

2026-06-13

SpaceX总裁肖特韦尔:星舰入轨飞行或今年达成 试飞计划稳步推进
来源:环球市场播报 SpaceX公司总裁格温妮・肖特韦尔谈及星舰轨道试飞:“这件事很大程度上取决于美国联邦航空管理局”肖特韦尔表示,星舰能否开展轨道试飞 “很大程度上取决于” 美国联邦航空管理局(FAA),…

2026-06-13

中美航天竞逐:长征9号与星舰V3同台竞技,中国重型火箭未来可期
2018年,我国公开了长征9号系列火箭的发展计划,目标是2028年首飞。将长征9号与星舰V3对比,不难发现我国火箭在尺寸和直径上明显更胜一筹。 以俄罗斯为例,联盟5号系列火箭于20…

2026-06-13