阿里云开源全球首个原生端到端全模态AI模型Qwen3-Omni,突破多模态技术瓶颈 阿里云正式开源全球首个原生端到端全模态AI模型Qwen3-Omni,实现文本、图像、音频、视频同步处理,22项基准测试达SOTA水平,支持119种语言,将推动自动驾驶、智能座舱等场景技术落地。 AI产品动态# AI技术# Qwen3-Omni# 人工智能 4周前
全球首个完全开源语音大模型LLaSO发布,支持87种语言精准识别 深度逻辑智能发布全球首个完全开源语音大模型LLaSO,支持87种语言高精度识别,噪声环境准确率提升23%,适用于智能家居、车载交互及医疗金融领域,推动语音AI技术协同创新与产业生态发展。 AI产品动态# AI技术# LLaSO框架# 人工智能 1个月前
OpenAI Evals重大更新:原生音频评估功能上线,语音模型测试效率提升40% OpenAI Evals推出原生音频评估功能,支持直接上传音频文件进行端到端测试,消除转录失真,提升40%评估可信度。适用于语音助手、语音识别及AI语音生成的质量监控,加速语音AI产品迭代。 AI产品动态# AI测试工具# OpenAI# 多模态AI 1个月前
阿里巴巴发布Qwen3-ASR-Flash语音识别模型:抗噪性能提升40%,支持11种语言 阿里巴巴2025年发布Qwen3-ASR-Flash语音识别模型,支持11种语言,极端噪声环境下识别准确率超92%,功耗低于0.5W,适用于直播、客服、会议等多场景,现已在ModelScope开放体验... AI产品动态# AI模型# ASR技术# Qwen3 1个月前
钉钉与通义实验室联合发布Fun-ASR语音大模型,企业级语音识别精准度提升20% 钉钉与通义实验室联合发布Fun-ASR语音识别大模型,基于亿小时行业数据训练,提升保险、家居、畜牧等领域识别准确率20%,支持企业定制热词,集成钉钉会议与语音助手功能。 AI产品动态# AI大模型# Fun-ASR# 企业级AI 2个月前