ITBEAR科技资讯
网站首页 科技资讯 财经资讯 分享好友

AI语音赛道新星Cartesia获英伟达等1亿美元融资 斯坦福华人团队携Sonic-3模型入局

时间:2025-11-04 15:43:32来源:快讯编辑:快讯

美国语音生成领域迎来重要突破——初创企业Cartesia正式推出新一代语音模型Sonic-3,并宣布完成1亿美元战略融资,英伟达成为核心投资方。这款采用非Transformer架构的模型,凭借其低延迟特性在实时语音交互领域引发关注,数千家企业已将其应用于每月数百万次的对话处理。

技术团队构成堪称"学术全明星":由5位斯坦福AI实验室研究员创立的Cartesia,其核心成员包括Mamba架构主要开发者Albert Gu、前谷歌大脑工程师Brandon Yang,以及拥有斯坦福与卡内基梅隆双重学术背景的CEO Karan Goel。团队将状态空间模型(SSM)研究成果转化为商业应用,Albert Gu更凭借技术贡献入选《时代》杂志2024年全球影响力人物榜单。

与传统Transformer模型不同,Sonic-3采用的SSM架构通过持续理解对话脉络实现高效预测。实测显示,该模型中文生成响应时间仅2秒,虽流畅度待提升,但英文表现已达自然水准,纪录片旁白测试中几乎无法分辨AI痕迹。其90毫秒的模型延迟与190毫秒内端到端响应,使系统跻身全球最快实时语音AI之列。

功能层面,Sonic-3支持42种语言与500余种音色选择,中文提供10种声线,英文细分为11种地域口音。通过API参数与SSML标签,用户可精确控制音量、语速及情感表达,甚至实现笑声、语调等微妙情感转换。新增的语音克隆功能支持微调,使生成语音更贴近参考原声,自动缓冲技术则显著提升实时交互的流畅性。

商业应用方面,Cartesia构建的企业级平台集成文本转语音(Sonic)与语音转文本(Ink)模型,支持客户构建具备复杂任务处理能力的语音Agent。ServiceNow等企业已将其用于客户支持、日程管理等场景,产品副总裁Ravi Krishnamurthy评价称:"SSM架构为企业级应用带来了前所未有的速度与质量。"

融资进程显示市场高度认可:2024年12月获Index Ventures领投的2700万美元种子轮融资后,仅隔3个月便完成6400万美元A轮融资。此次1亿美元战略融资将加速技术迭代,在MiniMax、ElevenLabs等竞争对手环伺的AI音频生成赛道,Cartesia正以SSM架构开辟差异化竞争路径。

更多热门内容
2025乌镇峰会启幕在即,909名“05后”为主力“小梧桐”志愿者正式出征
3日下午,2025年世界互联网大会乌镇峰会志愿者出征仪式在桐乡乌镇举行,服务本届大会的909名志愿者“小梧桐”集体宣誓,正式出征。他希望可以把“小我”融入乌镇峰会服务的“大我”,在合作中凝聚力量,以服务彰显风…

2025-11-04

2026武汉工博会:多关节与直角坐标机器人齐聚 共探智造新未来
2026年9月22日至24日,武汉国际博览中心将再度成为全球工业装备领域的焦点——武汉工博会将启幕,其中机器人专区以多关节机器人、直角坐标型机器人及机器人配件三大板块为重点,构建起从单机设备到产业链条的立体展…

2025-11-04

国华智能2025高工人形机器人年会大放异彩 全栈自研实力获产业链高度认可
在资本巨头下注、明星企业加速交付的背景下,年会聚焦于技术路线、供应链重塑和商业模式等核心问题,旨在为具身智能机器人全产业链提供交流平台,定义行业未来。 在产品规范方面,国华智能打造的面积达6万平米的现代化生…

2025-11-04

商用清洁机器人国家标准获批,2026年5月1日起规范行业品质
新华社北京11月3日电(记者赵文君)记者11月3日从市场监管总局获悉,商用清洁机器人国家标准近日批准发布,将于2026年5月1日实施。 该标准适用范围覆盖商场、酒店、写字楼、地下车库等商用环境中使用的清洁机…

2025-11-04

中国科研人员创新激光“擦除”术 打造柔性超薄织物助力高速飞机隐身
研究成果表明,G@SFM作为新一代电磁波吸收技术的变革性解决方案具有广阔前景,不仅能为航空航天应用提供结构与热稳定性,更可在卫星有效载荷防护、国防平台隐身表面、极端工业/空间环境下高温电子设备的电磁屏蔽等新…

2025-11-04

中科院新成果:蚕丝蛋白赋能柔性神经界面 精准监测深脑区
中科院团队的创新方案完美破解这一矛盾——将形状记忆丝蛋白支架与可变形微电极阵列结合,器件可微型化装入临床常用微创手术导管,实现微创递送。 进入大脑侧脑室后,丝蛋白支架在脑脊液环境中触发形状记忆功能,自动展开…

2025-11-04