腾讯混元ASR语音识别大模型接入ima平台，手机App端实现高效语音输入

腾讯混元自主研发的ASR语音识别大模型近日正式接入ima平台，首次在手机App端实现语音直接输入功能，为用户带来高效便捷的交互体验。该功能于2025年7月22日上线，支持用户通过语音输入问题或记录灵感，显著提升输入效率。

技术层面，腾讯混元ASR大模型采用业界首个基于双编码器的流式ASR架构，相比传统技术显著提升语义理解能力，尤其在复杂环境及中英文混杂场景中表现优异。其识别速度达每分钟300字，较手动输入快4倍，且识别结果更精准自然。该功能已覆盖知识库问答、笔记创作等场景：用户可通过语音输入长问题查询知识库；撰写笔记时，系统能根据历史内容智能续写，实现无缝衔接。iOS用户还可通过桌面小组件快速调用语音输入。

市场分析显示，语音识别技术正加速人机交互变革。腾讯混元团队表示将持续优化模型，重点提升方言及多语言识别能力，以满足多样化需求。此次技术落地不仅体现腾讯在语音识别领域的技术实力，也为智能交互发展开辟新路径。随着5G及AI算力发展，语音识别有望进一步渗透至更多生活场景，推动数字化转型进程。