语音大模型

共 3 篇AI资讯

语音大模型

排序

发布更新浏览

小米开源语音大模型Xiaomi-MiMo-Audio：7B级别性能全球领先，超越谷歌Gemini与OpenAI GPT-4o

小米开源语音大模型Xiaomi-MiMo-Audio：7B级别性能全球领先，超越谷歌Gemini与OpenAI GPT-4o

小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio，在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智...

AI产品动态 # AI开源 # 人机交互 # 多模态AI

8个月前

全球首个完全开源语音大模型LLaSO发布，支持87种语言精准识别

全球首个完全开源语音大模型LLaSO发布，支持87种语言精准识别

深度逻辑智能发布全球首个完全开源语音大模型LLaSO，支持87种语言高精度识别，噪声环境准确率提升23%，适用于智能家居、车载交互及医疗金融领域，推动语音AI技术协同创新与产业生态发展。

AI产品动态 # AI技术 # LLaSO框架 # 人工智能

8个月前

阶跃星辰发布开源语音大模型Step-Audio 2 mini，多模态架构革新语音交互

阶跃星辰发布开源语音大模型Step-Audio 2 mini，多模态架构革新语音交互

阶跃星辰发布开源语音大模型Step-Audio 2 mini，突破端到端多模态架构，在MMAU、URO Bench测试中领先，中文识别错误率仅3.19%，已与吉利、TCL合作落地，推动语音交互技术革新...

AI产品动态 # Step-Audio # 人工智能 # 多模态AI

9个月前