法国Kyutai实验室开源多语言语音合成模型TTS,实现低延迟实时语音交互 法国Kyutai实验室发布开源语音合成模型Kyutai TTS,支持12种语言200毫秒低延迟生成,创新融合情感语音建模与边缘计算,MOS评分4.2分。适用于智能客服、游戏陪玩等场景,GitHub已开... AI产品动态# AI# KyutaiTTS# 多语言处理 1个月前
科大讯飞声音复刻技术重大升级:10秒音频即可生成高还原音色 科大讯飞最新声音复刻技术仅需10秒音频即可生成高还原音色,支持多语种和方言,已获发明专利。了解这项AI语音技术的突破性进展及应用场景。 AI产品动态# AI语音# 人工智能# 声音复刻 1个月前
MiniMax发布Voice Design音色设计功能,AI语音合成进入个性化时代 稀宇科技MiniMax发布Voice Design音色设计功能,通过自然语言交互实现音色全维度定制,支持5000字符输入和12项参数微调,能生成世界上不存在的音色,标志着AI语音合成进入个性化时代。 AI产品动态# AI语音# MiniMax# VoiceDesign 2个月前
豆包电脑版上线AI播客功能 语音拟真度获用户高度评价 豆包电脑版及网页版全量上线“AI播客”功能,用户可通过上传PDF或网页链接一键生成双人对话式播客内容。该功能基于豆包大模型团队研发的语音播客模型,其语音效果因高度拟人化、自然停顿及语气词模拟等特点引发... AI产品动态# AI应用# AI播客# 科技新闻 2个月前