文本转语音

共 4 篇AI资讯

文本转语音

排序

发布更新浏览

谷歌Gemini 2.5 TTS重大升级：情绪化语音、自适应节奏与多语言对话革新AI语音合成

谷歌Gemini 2.5 TTS重大升级：情绪化语音、自适应节奏与多语言对话革新AI语音合成

谷歌Gemini 2.5 Flash与Pro文本转语音模型2025年重大升级，实现情绪级表达、上下文自适应节奏及24种语言多角色对话支持，提升语音自然度，适用于有声读物、游戏NPC配音等场景，推动AI...

AI产品动态 # AI新闻 # AI语音合成 # TTS升级

6个月前

智谱科技发布工业级文本转语音模型GLM-TTS：3秒音色克隆、10万小时低数据训练，开源语音合成新标杆

智谱科技发布工业级文本转语音模型GLM-TTS：3秒音色克隆、10万小时低数据训练，开源语音合成新标杆

智谱科技发布开源工业级文本转语音模型GLM-TTS，实现3秒音色克隆、10万小时低数据训练需求，字错误率低至0.89%。模型已应用于教育、客服等场景，训练成本降低50%以上，助力语音合成技术普惠化。

AI产品动态 # AI技术 # GLM-TTS # 多模态大模型

6个月前

微软发布VibeVoice-Realtime-0.5B：5亿参数实现300ms实时语音合成，支持中英文与多角色对话

微软发布VibeVoice-Realtime-0.5B：5亿参数实现300ms实时语音合成，支持中英文与多角色对话

微软最新开源轻量级实时文本转语音模型VibeVoice-Realtime-0.5B，以仅5亿参数实现300毫秒首音延迟，支持中英文双语合成与4角色自然对话，适用于智能客服、数字人、电商直播等场景，推动...

AI产品动态 # AI语音模型 # TTS # VibeVoice

6个月前

微软Copilot Labs上线AI语音生成工具，支持情感化叙事与多角色对话

微软Copilot Labs上线AI语音生成工具，支持情感化叙事与多角色对话

探索微软Copilot Labs最新AI语音生成工具：支持情感化输出与多角色故事模式，免费生成英文音频，了解微软在生成式AI领域的技术布局与社区共创战略。

AI产品动态 # AI语音生成 # CopilotLabs # 人工智能工具

9个月前