AI语音合成

李沐团队开源语音大模型Higgs Audio V2：多语言对话生成与零样本克隆技术解析

深度解读李沐团队开源的Higgs Audio V2语音大模型：该模型以75.7%情感表达胜率刷新TTS基准，实现5秒音色克隆与多角色情感对话，将重塑智能客服、虚拟主播等场景的语音交互体验。

10个月前

Resemble AI开源语音合成模型Chatterbox Turbo：5秒克隆人声，内置抗编辑水印

Resemble AI发布开源语音合成模型Chatterbox Turbo，仅5秒音频即可克隆人声，音质优于竞品。模型支持免费商用、多语言生成与抗编辑水印，适用于客服、游戏等实时场景，推动AI语音技术...

AI产品动态 # AI语音合成 # ChatterboxTurbo # ResembleAI

5个月前

科大讯飞发布百变声音复刻技术，单句录音即可高保真复刻音色

科大讯飞正式发布百变声音复刻技术，仅需一句录音即可实现98%音色相似度的高保真复刻，同时推出多模态数字人小飞，在数字内容生产、教育、客服等领域具有广泛应用前景。

AI产品动态 # AI语音合成 # 人工智能 # 声音复刻

7个月前

B站发布IndexTTS2语音合成模型：精准控时与情感保留技术实现重大突破

哔哩哔哩发布新一代语音合成模型IndexTTS2，突破精准控时与情感保留技术瓶颈，支持中英文双语生成。本文深度解析其混合架构设计、情感解耦技术及多模态性能表现，探讨在虚拟偶像、影视配音等领域的应用前景...

AI产品动态 # AI语音合成 # B站 # IndexTTS2

11个月前

AI语音克隆实现以假乱真：研究证实合成语音与真人录音难以区分

伦敦大学研究证实：最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战，为关注人工智能发展的读者提供专业见解。

AI新闻资讯 # AI语音合成 # 人工智能伦理 # 人机交互

8个月前

火山引擎豆包大模型全面升级：语音合成2.0突破情感演绎，1.6版本首创思考长度分档调节

火山引擎豆包大模型实现全面升级：语音合成2.0模型突破情感演绎能力，支持11项参数动态调节；1.6版本首创思考长度分档调节，效率提升84.6%，成本降低53.3%。日均tokens调用量突破30万亿...

AI产品动态 # AI语音合成 # 企业AI应用 # 大模型技术

7个月前

谷歌Gemini 2.5 TTS重大升级：情绪化语音、自适应节奏与多语言对话革新AI语音合成

谷歌Gemini 2.5 Flash与Pro文本转语音模型2025年重大升级，实现情绪级表达、上下文自适应节奏及24种语言多角色对话支持，提升语音自然度，适用于有声读物、游戏NPC配音等场景，推动AI...

AI产品动态 # AI新闻 # AI语音合成 # TTS升级

6个月前

Soul AI Lab开源播客语音合成模型SoulX-Podcast，支持多方言60分钟稳定对话

Soul AI Lab开源播客语音合成模型SoulX-Podcast，采用LLM+Flow Matching技术，支持中英文及四川话等方言，具备零样本音色克隆、跨方言音色转换能力，可稳定输出60分钟自...

AI产品动态 # AIGC # AI语音合成 # SoulX-Podcast

7个月前

小红书发布FireRedTTS-2：新一代多语言对话合成模型，实现零样本声音克隆与实时流式生成

小红书FireRedTTS-2模型突破语音合成技术瓶颈，支持实时流式多语言对话生成与单句声音克隆，自然度媲美真实录音。开源代码覆盖中英日韩法等语言，适用于语音识别和交互数据构建。

AI产品动态 # AI语音合成 # FireRedTTS-2 # 声音克隆

9个月前

B站IndexTTS-2.0重磅开源：工业级零样本TTS实现情感与时长精准控制

哔哩哔哩开源IndexTTS-2.0零样本语音合成系统，实现工业级情感与时长精准控制。支持中英混合发音校正和实时参数调节，适用于视频配音、有声读物等场景，降低语音合成技术成本。

AI产品动态 # AIGC # AI语音合成 # IndexTTS

9个月前

李沐团队开源语音大模型Higgs Audio V2：多语言对话生成与零样本克隆技术解析

Resemble AI开源语音合成模型Chatterbox Turbo：5秒克隆人声，内置抗编辑水印

科大讯飞发布百变声音复刻技术，单句录音即可高保真复刻音色

B站发布IndexTTS2语音合成模型：精准控时与情感保留技术实现重大突破

AI语音克隆实现以假乱真：研究证实合成语音与真人录音难以区分

火山引擎豆包大模型全面升级：语音合成2.0突破情感演绎，1.6版本首创思考长度分档调节

谷歌Gemini 2.5 TTS重大升级：情绪化语音、自适应节奏与多语言对话革新AI语音合成

Soul AI Lab开源播客语音合成模型SoulX-Podcast，支持多方言60分钟稳定对话

小红书发布FireRedTTS-2：新一代多语言对话合成模型，实现零样本声音克隆与实时流式生成

B站IndexTTS-2.0重磅开源：工业级零样本TTS实现情感与时长精准控制

热门AI工具

最新资讯