谷歌Gemini 2.5 TTS重大升级:情绪化语音、自适应节奏与多语言对话革新AI语音合成 谷歌Gemini 2.5 Flash与Pro文本转语音模型2025年重大升级,实现情绪级表达、上下文自适应节奏及24种语言多角色对话支持,提升语音自然度,适用于有声读物、游戏NPC配音等场景,推动AI... AI产品动态# AI新闻# AI语音合成# TTS升级 4天前
智谱科技发布工业级文本转语音模型GLM-TTS:3秒音色克隆、10万小时低数据训练,开源语音合成新标杆 智谱科技发布开源工业级文本转语音模型GLM-TTS,实现3秒音色克隆、10万小时低数据训练需求,字错误率低至0.89%。模型已应用于教育、客服等场景,训练成本降低50%以上,助力语音合成技术普惠化。 AI产品动态# AI技术# GLM-TTS# 多模态大模型 4天前
微软发布VibeVoice-Realtime-0.5B:5亿参数实现300ms实时语音合成,支持中英文与多角色对话 微软最新开源轻量级实时文本转语音模型VibeVoice-Realtime-0.5B,以仅5亿参数实现300毫秒首音延迟,支持中英文双语合成与4角色自然对话,适用于智能客服、数字人、电商直播等场景,推动... AI产品动态# AI语音模型# TTS# VibeVoice 7天前
微软Copilot Labs上线AI语音生成工具,支持情感化叙事与多角色对话 探索微软Copilot Labs最新AI语音生成工具:支持情感化输出与多角色故事模式,免费生成英文音频,了解微软在生成式AI领域的技术布局与社区共创战略。 AI产品动态# AI语音生成# CopilotLabs# 人工智能工具 3个月前