全球首个完全开源语音大模型LLaSO发布,支持87种语言精准识别

AI产品动态21小时前发布 AI视野

北京深度逻辑智能科技有限公司近日发布全球首个完全开源的端到端语音大模型框架LLaSO,这一突破性技术成果正在重塑语音AI领域的研究范式与产业生态。作为首个实现底层代码、训练数据及模型架构全面开放的研究框架,LLaSO已吸引全球超过300家科研机构与企业的积极参与。

技术架构方面,LLaSO采用模块化设计,支持87种语言及方言的精准识别,在噪声环境下的识别准确率较传统模型提升23%。其独特的自学习机制可实现参数实时优化,某汽车厂商测试数据显示,搭载该框架的语音系统指令响应速度缩短至0.8秒,显著提升智能家居、车载交互等场景的体验效果。

公司首席执行官强调,该框架的”乐高积木式”开源特性将彻底改变行业创新模式。目前MIT媒体实验室等顶尖机构已加入联合研发,共同推进多语种混合识别等前沿课题。配套启动的”星火计划”将在未来一年举办20场技术工作坊,首批开发者已基于该框架开发出医疗问诊辅助、方言保护等创新应用。

行业分析指出,这种透明化技术基础设施将推动60%新兴语音应用转向开源架构。某金融科技公司利用其模块化特性快速构建的反欺诈语音验证系统,印证了框架的商业化潜力。技术社区每周超5万行的代码贡献量,标志着协同创新生态已初步形成。

© 版权声明

相关文章