火山引擎豆包大模型全面升级:语音合成2.0突破情感演绎,1.6版本首创思考长度分档调节 火山引擎豆包大模型实现全面升级:语音合成2.0模型突破情感演绎能力,支持11项参数动态调节;1.6版本首创思考长度分档调节,效率提升84.6%,成本降低53.3%。日均tokens调用量突破30万亿... AI产品动态# AI语音合成# 企业AI应用# 大模型技术 3天前
AI语音克隆实现以假乱真:研究证实合成语音与真人录音难以区分 伦敦大学研究证实:最新AI语音合成技术已达到与真人录音难以区分的水平。本文深度解析语音克隆的技术突破、商业应用前景及面临的伦理安全挑战,为关注人工智能发展的读者提供专业见解。 AI新闻资讯# AI语音合成# 人工智能伦理# 人机交互 3周前
ElevenLabs推出AI音视频制作平台Studio 3.0,革新多媒体创作流程 探索ElevenLabs Studio 3.0AI音视频制作平台的突破性功能:动态文本编辑、场景感知配乐、多语言字幕及语音修复技术,助力创作者高效生产专业级内容,适用于短视频、播客和教育领域。 AI产品动态# AI语音合成# 多媒体创作工具# 智能配乐 4周前
小红书发布FireRedTTS-2:新一代多语言对话合成模型,实现零样本声音克隆与实时流式生成 小红书FireRedTTS-2模型突破语音合成技术瓶颈,支持实时流式多语言对话生成与单句声音克隆,自然度媲美真实录音。开源代码覆盖中英日韩法等语言,适用于语音识别和交互数据构建。 AI产品动态# AI语音合成# FireRedTTS-2# 声音克隆 1个月前
B站IndexTTS-2.0重磅开源:工业级零样本TTS实现情感与时长精准控制 哔哩哔哩开源IndexTTS-2.0零样本语音合成系统,实现工业级情感与时长精准控制。支持中英混合发音校正和实时参数调节,适用于视频配音、有声读物等场景,降低语音合成技术成本。 AI产品动态# AIGC# AI语音合成# IndexTTS 1个月前
李沐团队开源语音大模型Higgs Audio V2:多语言对话生成与零样本克隆技术解析 深度解读李沐团队开源的Higgs Audio V2语音大模型:该模型以75.7%情感表达胜率刷新TTS基准,实现5秒音色克隆与多角色情感对话,将重塑智能客服、虚拟主播等场景的语音交互体验。 AI产品动态# AI语音合成# HiggsAudioV2# TTS技术 3个月前
B站发布IndexTTS2语音合成模型:精准控时与情感保留技术实现重大突破 哔哩哔哩发布新一代语音合成模型IndexTTS2,突破精准控时与情感保留技术瓶颈,支持中英文双语生成。本文深度解析其混合架构设计、情感解耦技术及多模态性能表现,探讨在虚拟偶像、影视配音等领域的应用前景... AI产品动态# AI语音合成# B站# IndexTTS2 3个月前