李沐团队开源语音大模型Higgs Audio V2:多语言对话生成与零样本克隆技术解析 深度解读李沐团队开源的Higgs Audio V2语音大模型:该模型以75.7%情感表达胜率刷新TTS基准,实现5秒音色克隆与多角色情感对话,将重塑智能客服、虚拟主播等场景的语音交互体验。 AI产品动态# AI语音合成# HiggsAudioV2# TTS技术 6个月前
B站发布IndexTTS2语音合成模型:精准控时与情感保留技术实现重大突破 哔哩哔哩发布新一代语音合成模型IndexTTS2,突破精准控时与情感保留技术瓶颈,支持中英文双语生成。本文深度解析其混合架构设计、情感解耦技术及多模态性能表现,探讨在虚拟偶像、影视配音等领域的应用前景... AI产品动态# AI语音合成# B站# IndexTTS2 7个月前
科大讯飞发布百变声音复刻技术,单句录音即可高保真复刻音色 科大讯飞正式发布百变声音复刻技术,仅需一句录音即可实现98%音色相似度的高保真复刻,同时推出多模态数字人小飞,在数字内容生产、教育、客服等领域具有广泛应用前景。 AI产品动态# AI语音合成# 人工智能# 声音复刻 3个月前
AI语音克隆实现以假乱真:研究证实合成语音与真人录音难以区分 伦敦大学研究证实:最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战,为关注人工智能发展的读者提供专业见解。 AI新闻资讯# AI语音合成# 人工智能伦理# 人机交互 4个月前
Soul AI Lab开源播客语音合成模型SoulX-Podcast,支持多方言60分钟稳定对话 Soul AI Lab开源播客语音合成模型SoulX-Podcast,采用LLM+Flow Matching技术,支持中英文及四川话等方言,具备零样本音色克隆、跨方言音色转换能力,可稳定输出60分钟自... AI产品动态# AIGC# AI语音合成# SoulX-Podcast 3个月前
小红书发布FireRedTTS-2:新一代多语言对话合成模型,实现零样本声音克隆与实时流式生成 小红书FireRedTTS-2模型突破语音合成技术瓶颈,支持实时流式多语言对话生成与单句声音克隆,自然度媲美真实录音。开源代码覆盖中英日韩法等语言,适用于语音识别和交互数据构建。 AI产品动态# AI语音合成# FireRedTTS-2# 声音克隆 5个月前
火山引擎豆包大模型全面升级:语音合成2.0突破情感演绎,1.6版本首创思考长度分档调节 火山引擎豆包大模型实现全面升级:语音合成2.0模型突破情感演绎能力,支持11项参数动态调节;1.6版本首创思考长度分档调节,效率提升84.6%,成本降低53.3%。日均tokens调用量突破30万亿... AI产品动态# AI语音合成# 企业AI应用# 大模型技术 4个月前
谷歌Gemini 2.5 TTS重大升级:情绪化语音、自适应节奏与多语言对话革新AI语音合成 谷歌Gemini 2.5 Flash与Pro文本转语音模型2025年重大升级,实现情绪级表达、上下文自适应节奏及24种语言多角色对话支持,提升语音自然度,适用于有声读物、游戏NPC配音等场景,推动AI... AI产品动态# AI新闻# AI语音合成# TTS升级 2个月前
B站IndexTTS-2.0重磅开源:工业级零样本TTS实现情感与时长精准控制 哔哩哔哩开源IndexTTS-2.0零样本语音合成系统,实现工业级情感与时长精准控制。支持中英混合发音校正和实时参数调节,适用于视频配音、有声读物等场景,降低语音合成技术成本。 AI产品动态# AIGC# AI语音合成# IndexTTS 5个月前
Resemble AI开源语音合成模型Chatterbox Turbo:5秒克隆人声,内置抗编辑水印 Resemble AI发布开源语音合成模型Chatterbox Turbo,仅5秒音频即可克隆人声,音质优于竞品。模型支持免费商用、多语言生成与抗编辑水印,适用于客服、游戏等实时场景,推动AI语音技术... AI产品动态# AI语音合成# ChatterboxTurbo# ResembleAI 4周前