AI语音克隆实现以假乱真:研究证实合成语音与真人录音难以区分 伦敦大学研究证实:最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战,为关注人工智能发展的读者提供专业见解。 AI新闻资讯# AI语音合成# 人工智能伦理# 人机交互 2个月前
Soul AI Lab开源播客语音合成模型SoulX-Podcast,支持多方言60分钟稳定对话 Soul AI Lab开源播客语音合成模型SoulX-Podcast,采用LLM+Flow Matching技术,支持中英文及四川话等方言,具备零样本音色克隆、跨方言音色转换能力,可稳定输出60分钟自... AI产品动态# AIGC# AI语音合成# SoulX-Podcast 1个月前
阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX,语音编辑进入自然语言指令时代 阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX,支持自然语言指令编辑,30亿参数实现高性能低门槛部署,在方言表现力和情感传递准确率方面领先行业,推动... AI产品动态# AI语音技术# Step-Audio-EditX# 大语言模型 3周前
Cartesia发布Sonic-3实时对话TTS模型:90毫秒延迟支持42种语言,基于SSM架构实现技术突破 Cartesia推出基于SSM架构的Sonic-3实时对话TTS模型,延迟仅90毫秒,支持42种语言,提供声音克隆和情感调节功能,为视频会议、即时通讯等场景带来革命性AI语音体验。 AI产品动态# AI语音合成# Cartesia# Sonic-3 1个月前