小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 1个月前
全球首个完全开源语音大模型LLaSO发布,支持87种语言精准识别 深度逻辑智能发布全球首个完全开源语音大模型LLaSO,支持87种语言高精度识别,噪声环境准确率提升23%,适用于智能家居、车载交互及医疗金融领域,推动语音AI技术协同创新与产业生态发展。 AI产品动态# AI技术# LLaSO框架# 人工智能 2个月前
阶跃星辰发布开源语音大模型Step-Audio 2 mini,多模态架构革新语音交互 阶跃星辰发布开源语音大模型Step-Audio 2 mini,突破端到端多模态架构,在MMAU、URO Bench测试中领先,中文识别错误率仅3.19%,已与吉利、TCL合作落地,推动语音交互技术革新... AI产品动态# Step-Audio# 人工智能# 多模态AI 2个月前