多语言处理

深度逻辑智能发布全球首个完全开源语音大模型LLaSO，支持87种语言高精度识别，噪声环境准确率提升23%，适用于智能家居、车载交互及医疗金融领域，推动语音AI技术协同创新与产业生态发展。

8个月前

百度开源PP-OCRv5 OCR模型，参数量仅0.07B却实现中英日等40余种语言高精度识别，移动端处理速度达370字符/秒，适用于文档扫描、工业质检等实时场景，免费下载部署。

9个月前

瑞士推出国家级开源大语言模型Apertus，支持1000+语言处理，提供透明合规的AI基础设施，适用于教育、金融及商业场景，强化数据安全与伦理规范。

9个月前

法国Kyutai实验室发布开源语音合成模型Kyutai TTS，支持12种语言200毫秒低延迟生成，创新融合情感语音建模与边缘计算，MOS评分4.2分。适用于智能客服、游戏陪玩等场景，GitHub已开...

11个月前

BRIDGE（Benchmarking Large Language Models for Understanding Real-world Clinical Practice Text）是全球首个专...

12个月前