Cartesia完成1亿美元融资推出Sonic-3语音模型，SSM架构突破Transformer限制

美国语音技术初创公司Cartesia近日宣布完成1亿美元新一轮融资，同时正式推出其第三代语音模型Sonic-3。此次融资距离该公司2025年3月完成的6400万美元A轮融资仅间隔8个月，显示出资本市场对其技术路线的高度认可。

Sonic-3采用创新的状态空间模型（SSM）架构，突破传统Transformer框架限制，在实时语音交互领域展现出显著优势。技术实测显示，该模型英文语音合成流畅度接近人类水平，中文处理能力虽仍有提升空间，但响应速度已突破2秒门槛。目前，包括ServiceNow、Cresta和Decagon在内的数千家企业已将其前代产品应用于客服系统，月均处理对话量达数百万次。

值得注意的是，Cartesia核心团队汇聚了来自Mamba和谷歌的技术专家，其中两位华人科学家在SSM架构研发中发挥关键作用。公司此前在2024年12月获得Index Ventures领投的2700万美元种子轮融资，至今累计融资额已超1.9亿美元。行业观察人士指出，非Transformer架构在特定垂直领域的突破性表现，正在重塑语音技术产业格局。

文章版权归作者所有，未经允许请勿转载。

Cartesia完成1亿美元融资推出Sonic-3语音模型，SSM架构突破Transformer限制

寒武纪发布NeuWare基础软件平台，实现AI模型快速迁移与全栈优化

BOLON与Rokid联合发布BZ5000 AI智能眼镜：38克超轻机身创行业新纪录

相关文章

科大讯飞星火大模型通过国家生成式AI安全标准认证，引领行业安全治理新阶段

腾讯混元3D Studio 1.1发布：AI生成3D资产进入专业生产级新阶段

蚂蚁集团发布全模态AI助手“灵光”，30秒生成可交互小程序

AI电商新突破：Infimate打造个性化购物助手“赛博闺蜜”

最新资讯

热门AI工具

热门资讯