全球首个完全开源语音大模型LLaSO发布,支持87种语言精准识别 深度逻辑智能发布全球首个完全开源语音大模型LLaSO,支持87种语言高精度识别,噪声环境准确率提升23%,适用于智能家居、车载交互及医疗金融领域,推动语音AI技术协同创新与产业生态发展。 AI产品动态# AI技术# LLaSO框架# 人工智能 1个月前
百度发布PP-OCRv5:0.07B参数实现多语言文本识别,效率提升13% 百度开源PP-OCRv5 OCR模型,参数量仅0.07B却实现中英日等40余种语言高精度识别,移动端处理速度达370字符/秒,适用于文档扫描、工业质检等实时场景,免费下载部署。 AI产品动态# HuggingFace# OCR# PP-OCRv5 1个月前
瑞士推出国家级开源大语言模型Apertus,推动AI透明与多语言创新 瑞士推出国家级开源大语言模型Apertus,支持1000+语言处理,提供透明合规的AI基础设施,适用于教育、金融及商业场景,强化数据安全与伦理规范。 AI产品动态# AI大模型# 多语言处理# 开源AI 1个月前
法国Kyutai实验室开源多语言语音合成模型TTS,实现低延迟实时语音交互 法国Kyutai实验室发布开源语音合成模型Kyutai TTS,支持12种语言200毫秒低延迟生成,创新融合情感语音建模与边缘计算,MOS评分4.2分。适用于智能客服、游戏陪玩等场景,GitHub已开... AI产品动态# AI# KyutaiTTS# 多语言处理 4个月前
哈佛医学院发布BRIDGE评测基准:全面评估大模型临床文本处理能力 BRIDGE(Benchmarking Large Language Models for Understanding Real-world Clinical Practice Text)是全球首个专... AI新闻资讯# AI医疗# 临床文本分析# 医学AI 4个月前