ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

谷歌AI同声传译新突破:任意耳机秒变翻译神器,情绪语调全保留

时间:2025-12-19 16:25:30来源:快讯编辑:快讯

科技巨头谷歌近日在翻译领域迈出重要一步,将升级后的Gemini 2.5 Flash原生语音模型整合至Google翻译,推出耳机实时语音翻译测试版功能。这项创新突破传统硬件限制,用户无需购买专用设备,只需佩戴任意耳机并连接安装Google翻译的安卓设备,即可开启实时翻译服务,实现单向聆听与双向对话的无缝切换。

该功能的核心优势在于"零硬件成本"与"情绪传递"技术。区别于苹果AirPods Pro 3需绑定特定iPhone机型的限制,谷歌方案支持所有有线、蓝牙及AI耳机,覆盖超过70种语言和2000个语言对。更引人注目的是其语音处理能力——通过Gemini 2.5 Flash模型,翻译不仅能保留说话者的语调、重音和节奏,还能在学术会议、跨国谈判等场景中区分不同发言者。演示视频显示,四位使用者分别使用韩语、英语、中文和德语交流,系统可精准识别主要说话者并在对话中动态切换语言。

技术层面,新模型将准确率提升至71.5%,多轮对话质量从62%跃升至83%。尽管海外用户反馈仍存在识别误差,尤其在专业术语翻译方面,但谷歌披露的数据显示其性能已显著优于前代。产品管理副总裁Rose Yao强调,这项技术突破使机器翻译从"信息传递"升级为"情感共鸣",例如西班牙语的热情重音或中文的含蓄语速都能被完整保留。

市场格局因此面临重构。当前同声传译领域存在三类主要方案:一是科大讯飞、时空壶等厂商的专用硬件,翻译准确率高达95%但售价昂贵;二是苹果生态的封闭方案,仅支持5种语言且需特定设备;三是Nebulabuds等轻量化APP,依赖第三方AI模型且需商业合作激活。谷歌的入局打破了这种平衡——其方案既无需硬件投入,又突破生态限制,虽在专业领域仍不及专用设备,但已实现"所有耳机皆可翻译"的普及化目标。

目前该功能已向美国、墨西哥和印度的安卓用户推送,计划2026年扩展至iOS生态及更多地区。行业观察者指出,这将对翻译耳机、AI眼镜等智能硬件造成冲击——当实时翻译成为基础功能而非产品卖点,厂商需重新思考差异化竞争策略。尽管谷歌方案尚不能完全替代专业设备,但其普惠性已为翻译技术普及开辟新路径。

更多热门内容
巴基斯坦2026年将派航天员进驻中国空间站 携手探索太空共筑航天梦
根据中国的载人航天计划,2026年将进行两次载人航天任务,分别是神舟二十三号和神舟二十四号。预计神舟二十三号的乘组中将有一名航天员需在空间站驻留超过一年,因此神舟二十三号返回时将有一个空座位,这很可能为巴基斯…

2025-12-31

小米YU9 SUV曝光!豪华六座+1500公里续航,或成家庭出行新选择
在小米汽车持续发力的背景下,继SU7和YU7车型之后,最新曝光的小米YU9SUV引发了广泛的关注。这款大型SUV不仅采用了增程式混合动力系统,预计续航可达1500公里,更是将豪华与实用完美结合。根据网络传出的…

2025-12-31