ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

阶跃星辰发布千亿参数语音大模型Step-1o,实现端到端语音交互新突破

时间:2024-12-14 18:11:37来源:ITBEAR编辑:快讯

近日,国内AI领域迎来了一项重大突破,阶跃星辰公司在其官方公众号上正式揭晓了其倾力打造的Step-1o千亿参数端到端语音大模型。这一创新成果被誉为国内首个达到千亿参数级别的端到端语音模型,标志着我国在语音技术领域迈出了坚实的一步。

传统语音模型往往采用级联处理方案,这一过程中,用户的语音信息首先需要被转化为文本,然后再经过二次处理转化为语音输出。这种处理方式不仅效率低下,而且在信息转换过程中容易丢失包括情感在内的诸多关键信息,从而导致模型反应迟钝、回答质量欠佳、智能水平有限以及情感表达刻板等问题。相比之下,Step-1o所采用的端到端语音方案则实现了语音理解和生成的一体化,极大地提升了模型的智商和情商。

Step-1o支持混合形式的输入和输出,无论是语音还是文本,都能轻松应对。其快速反应和随时打断的特性,使得用户体验更加流畅。更重要的是,Step-1o能够深度理解和模仿各种声音特征,包括音色、韵律、方言以及个性化的口语表达习惯等,为用户带来更加自然和真实的交互体验。

除了具备出色的理解和模仿能力外,Step-1o还通过自学和模仿不断提升回复质量。它既能提供解决问题的专业建议,也能作为高情绪价值的陪伴者,满足用户多样化的需求。Step-1o还继承了阶跃星辰语言大模型的创作能力,进一步丰富了其应用场景和可能性。

据阶跃星辰透露,Step-1o即将接入跃问App端,为用户提供实时语音通话服务。这一举措无疑将进一步提升跃问App的用户体验,同时也为Step-1o的应用推广打开了新的窗口。

更多热门内容
DeepSeek论文登《自然》封面,纯强化学习提升推理力,科技板块迎资金热潮
近日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》第645期的封面。一是实现混合推理架构,即一个模型同时支持思考模式与…

2025-09-22

索尼AI战略明晰:以AI赋能创作,拓展娱乐体验新边界
IT之家援引博文介绍,该系统不仅连接聊天与文本助手,还融入核心业务流程,已测试 300 多个 AI 相关项目,其中至少 50个投入常规使用。公司正将生成式 AI 与机器学习用于老片音频重制,并在 Play…

2025-09-22

华为全联接大会发布全球最强算力超节点与集群,助力AI算力持续发展
IT之家 9 月 18 日消息,今日,华为全联接大会 2025 在上海启幕,华为副董事长、轮值董事长徐直军发表题为“以开创的超节点互联技术,引领AI 基础设施新范式”的主题演讲,正式发布全球最强算力超节点和…

2025-09-22

姚期智谈“AI+量子”:融合发展开启量子智能新时代,潜力无限待挖掘
9月21日,在以“AI量子:量子智能”为主题的2025浦江创新论坛专题论坛上,中国科学院院士、上海期智研究院院长姚期智表示,推动人工智能与量子计算机融合发展,将把计算能力推向人类认知的一个极限,量子智能激发…

2025-09-22