李沐团队开源语音大模型Higgs Audio V2:多语言对话生成与零样本克隆技术解析 深度解读李沐团队开源的Higgs Audio V2语音大模型:该模型以75.7%情感表达胜率刷新TTS基准,实现5秒音色克隆与多角色情感对话,将重塑智能客服、虚拟主播等场景的语音交互体验。 AI产品动态# AI语音合成# HiggsAudioV2# TTS技术 1个月前
B站发布IndexTTS2语音合成模型:精准控时与情感保留技术实现重大突破 哔哩哔哩发布新一代语音合成模型IndexTTS2,突破精准控时与情感保留技术瓶颈,支持中英文双语生成。本文深度解析其混合架构设计、情感解耦技术及多模态性能表现,探讨在虚拟偶像、影视配音等领域的应用前景... AI产品动态# AI语音合成# B站# IndexTTS2 2个月前