语音克隆

Resemble AI发布开源语音合成模型Chatterbox Turbo，仅5秒音频即可克隆人声，音质优于竞品。模型支持免费商用、多语言生成与抗编辑水印，适用于客服、游戏等实时场景，推动AI语音技术...

5个月前

伦敦大学研究证实：最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战，为关注人工智能发展的读者提供专业见解。

8个月前

Soul AI Lab开源播客语音合成模型SoulX-Podcast，采用LLM+Flow Matching技术，支持中英文及四川话等方言，具备零样本音色克隆、跨方言音色转换能力，可稳定输出60分钟自...

7个月前

阿里巴巴通义实验室发布Qwen3-TTS文本转语音模型，具备49种高保真音色、多语言方言支持及行业领先的语音自然度（MOS 4.53分）。模型覆盖中英文等10种语言及9种方言，适用于教育、商业等场景...

6个月前

Cartesia推出基于SSM架构的Sonic-3实时对话TTS模型，延迟仅90毫秒，支持42种语言，提供声音克隆和情感调节功能，为视频会议、即时通讯等场景带来革命性AI语音体验。

7个月前

阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX，支持自然语言指令编辑，30亿参数实现高性能低门槛部署，在方言表现力和情感传递准确率方面领先行业，推动...

7个月前