YouTube推出AI音乐主持人功能:基于Gemini大模型打造个性化音乐体验 深度解析YouTube最新推出的AI音乐主持人功能:基于Google Gemini大模型和语音合成技术,为Premium用户提供个性化音乐解说服务,对比Spotify AI DJ的差异化优势,展望音乐... AI新闻资讯# AI音乐主持人# GoogleGemini# YouTube 2个月前
法国Kyutai实验室开源多语言语音合成模型TTS,实现低延迟实时语音交互 法国Kyutai实验室发布开源语音合成模型Kyutai TTS,支持12种语言200毫秒低延迟生成,创新融合情感语音建模与边缘计算,MOS评分4.2分。适用于智能客服、游戏陪玩等场景,GitHub已开... AI产品动态# AI# KyutaiTTS# 多语言处理 5个月前
微软Copilot Audio Expressions发布:AI语音生成工具实现多角色情感叙事 微软Copilot Audio Expressions基于MAI-Voice-1模型,提供Emotive情感表达与Story多角色故事创作模式,支持90秒专业级音频生成,无需注册即可下载MP3,推动A... AI产品动态# AI工具# AI语音生成# CopilotAudioExpressions 3个月前
Cartesia完成1亿美元融资推出Sonic-3语音模型,SSM架构突破Transformer限制 美国AI语音技术公司Cartesia完成1亿美元融资,正式推出第三代语音模型Sonic-3。采用创新SSM架构突破Transformer限制,实现接近人类水平的英文语音合成和2秒内中文响应速度,已获S... AI产品动态# AI语音技术# Cartesia# Sonic-3 4周前
豆包语音推出AI多人有声剧自动化方案,文本到成品全流程AI生产 豆包语音团队推出AI多人有声剧全流程自动化方案,通过多角色TTS演播系统和AI后期链路,实现从文本到成品的智能生产,制作周期缩短90%,成本降低70%,首批作品已在番茄小说APP上线。 AI产品动态# AI技术# AI有声剧# TTS技术 1个月前