谷歌Gemini 2.5 TTS重大升级:情绪化语音、自适应节奏与多语言对话革新AI语音合成 谷歌Gemini 2.5 Flash与Pro文本转语音模型2025年重大升级,实现情绪级表达、上下文自适应节奏及24种语言多角色对话支持,提升语音自然度,适用于有声读物、游戏NPC配音等场景,推动AI... AI产品动态# AI新闻# AI语音合成# TTS升级 2个月前
阿里发布Qwen3-TTS语音模型升级版:音色克隆3秒完成,支持10种语言与动物声纹拟人化 阿里巴巴发布Qwen3-TTS-VD/VC语音模型升级版,实现3秒极速音色克隆、支持10种语言及动物声纹拟人化,在WER指标上超越GPT-4o等国际模型。集成49种音色与8种方言,提供200毫秒低延迟... AI产品动态# AI应用# AI语音技术# Qwen3-TTS 1个月前
阿里通义实验室发布Qwen3-TTS:49种高保真音色+多语言方言,语音合成自然度行业领先 阿里巴巴通义实验室发布Qwen3-TTS文本转语音模型,具备49种高保真音色、多语言方言支持及行业领先的语音自然度(MOS 4.53分)。模型覆盖中英文等10种语言及9种方言,适用于教育、商业等场景... AI产品动态# AI语音合成# Qwen3-TTS# TTS模型 2个月前