网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

AI语音赛道新星Cartesia获英伟达等1亿美元融资 斯坦福华人团队携Sonic-3模型入局

2025-11-04来源:快讯编辑:瑞雪

美国语音生成领域迎来重要突破——初创企业Cartesia正式推出新一代语音模型Sonic-3,并宣布完成1亿美元战略融资,英伟达成为核心投资方。这款采用非Transformer架构的模型,凭借其低延迟特性在实时语音交互领域引发关注,数千家企业已将其应用于每月数百万次的对话处理。

技术团队构成堪称"学术全明星":由5位斯坦福AI实验室研究员创立的Cartesia,其核心成员包括Mamba架构主要开发者Albert Gu、前谷歌大脑工程师Brandon Yang,以及拥有斯坦福与卡内基梅隆双重学术背景的CEO Karan Goel。团队将状态空间模型(SSM)研究成果转化为商业应用,Albert Gu更凭借技术贡献入选《时代》杂志2024年全球影响力人物榜单。

与传统Transformer模型不同,Sonic-3采用的SSM架构通过持续理解对话脉络实现高效预测。实测显示,该模型中文生成响应时间仅2秒,虽流畅度待提升,但英文表现已达自然水准,纪录片旁白测试中几乎无法分辨AI痕迹。其90毫秒的模型延迟与190毫秒内端到端响应,使系统跻身全球最快实时语音AI之列。

功能层面,Sonic-3支持42种语言与500余种音色选择,中文提供10种声线,英文细分为11种地域口音。通过API参数与SSML标签,用户可精确控制音量、语速及情感表达,甚至实现笑声、语调等微妙情感转换。新增的语音克隆功能支持微调,使生成语音更贴近参考原声,自动缓冲技术则显著提升实时交互的流畅性。

商业应用方面,Cartesia构建的企业级平台集成文本转语音(Sonic)与语音转文本(Ink)模型,支持客户构建具备复杂任务处理能力的语音Agent。ServiceNow等企业已将其用于客户支持、日程管理等场景,产品副总裁Ravi Krishnamurthy评价称:"SSM架构为企业级应用带来了前所未有的速度与质量。"

融资进程显示市场高度认可:2024年12月获Index Ventures领投的2700万美元种子轮融资后,仅隔3个月便完成6400万美元A轮融资。此次1亿美元战略融资将加速技术迭代,在MiniMax、ElevenLabs等竞争对手环伺的AI音频生成赛道,Cartesia正以SSM架构开辟差异化竞争路径。

百度AI成果井喷:从智能涌现到效果涌现,产业结构迈向健康倒金字塔
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-15

百度世界大会:李彦宏携AI“军火库”全面开放,开启应用新篇章
现场演示连线数字人罗永浩环节上,出现了“翻车”这一尴尬现象时,李彦宏的情绪也并没有太多波动,而是感觉“有点遗憾”,并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。 还有大模型层面上的文…

2025-11-15

百度世界大会发布AI新成果:文心5.0等亮相,李彦宏畅谈AI内化生产力变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13

百度“文心杯”第三届落幕:8支团队获千万投资,李彦宏力推AI应用普及
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

2025百度世界大会聚焦AI发展:成果发布,内化能力引领新质生产力变革
本届大会以“效果涌现”为主题,聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海,呈现了百度作为中国人工智能领军企业,如何将AI技术内化为产业发展的原生动能,为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13