巨人网络与清华联合发布开源方言语音合成大模型DiaMoE-TTS,突破方言AI技术壁垒 巨人网络与清华大学联合研发的多方言语音合成大模型DiaMoE-TTS正式开源,采用MoE架构和IPA标准化体系,解决方言合成技术难题,支持广东话、四川话等多方言场景,推动语言多样性数字化保护。 AI新闻资讯# AI大模型# DiaMoE-TTS# SATLab 3天前
Hume AI发布新一代语音模型Octave 2:性能翻倍,成本减半 Hume AI推出革命性Octave 2语音AI模型,性能提升100%同时运营成本降低50%。新一代模型支持复杂多轮对话,增强情感识别能力,为企业提供高效低成本的AI语音解决方案,现已开放试用。 AI产品动态# AI模型# AI语音助手# HumeAI 1周前
OpenAI发布GPT-Realtime语音对话模型:延迟降低、多语言支持与图像感知成亮点 OpenAI于2025年发布新一代语音对话模型GPT-Realtime,实现端到端单架构设计,降低延迟并提升交互自然度。支持高保真语音、多语言切换及图像感知功能,定价降低20%,加速B端场景落地。了解... AI产品动态# AI商业化# AI技术# GPT-Realtime 2个月前
Meta以近1亿美元收购AI语音公司PlayAI,强化语音AI技术布局 Meta以近1亿美元完成对PlayAI的收购,整合其实时语音克隆与多语言TTS技术,加速语音AI领域布局。此次交易是Meta年度720亿美元AI投入计划的关键部分,旨在应对与OpenAI、谷歌的竞争。 AI新闻资讯# AI语音# Meta# PlayAI 3个月前