Cartesia完成1亿美元融资推出Sonic-3语音模型,SSM架构突破Transformer限制

AI产品动态9小时前发布 AI视野

美国语音技术初创公司Cartesia近日宣布完成1亿美元新一轮融资,同时正式推出其第三代语音模型Sonic-3。此次融资距离该公司2025年3月完成的6400万美元A轮融资仅间隔8个月,显示出资本市场对其技术路线的高度认可。

Sonic-3采用创新的状态空间模型(SSM)架构,突破传统Transformer框架限制,在实时语音交互领域展现出显著优势。技术实测显示,该模型英文语音合成流畅度接近人类水平,中文处理能力虽仍有提升空间,但响应速度已突破2秒门槛。目前,包括ServiceNow、Cresta和Decagon在内的数千家企业已将其前代产品应用于客服系统,月均处理对话量达数百万次。

值得注意的是,Cartesia核心团队汇聚了来自Mamba和谷歌的技术专家,其中两位华人科学家在SSM架构研发中发挥关键作用。公司此前在2024年12月获得Index Ventures领投的2700万美元种子轮融资,至今累计融资额已超1.9亿美元。行业观察人士指出,非Transformer架构在特定垂直领域的突破性表现,正在重塑语音技术产业格局。

© 版权声明

相关文章