腾讯混元ASR语音识别大模型接入ima平台,手机App端实现高效语音输入

腾讯混元自主研发的ASR语音识别大模型近日正式接入ima平台,首次在手机App端实现语音直接输入功能,为用户带来高效便捷的交互体验。该功能于2025年7月22日上线,支持用户通过语音输入问题或记录灵感,显著提升输入效率。

技术层面,腾讯混元ASR大模型采用业界首个基于双编码器的流式ASR架构,相比传统技术显著提升语义理解能力,尤其在复杂环境及中英文混杂场景中表现优异。其识别速度达每分钟300字,较手动输入快4倍,且识别结果更精准自然。该功能已覆盖知识库问答、笔记创作等场景:用户可通过语音输入长问题查询知识库;撰写笔记时,系统能根据历史内容智能续写,实现无缝衔接。iOS用户还可通过桌面小组件快速调用语音输入。

市场分析显示,语音识别技术正加速人机交互变革。腾讯混元团队表示将持续优化模型,重点提升方言及多语言识别能力,以满足多样化需求。此次技术落地不仅体现腾讯在语音识别领域的技术实力,也为智能交互发展开辟新路径。随着5G及AI算力发展,语音识别有望进一步渗透至更多生活场景,推动数字化转型进程。

© 版权声明

相关文章