华为开源轻量级大模型openPangu-Embedded-7B-v1.1，实现快慢思维自由切换突破

华为近日正式开源了其最新研发的轻量级大模型openPangu-Embedded-7B-v1.1，该模型以7B参数规模实现了业界首创的快慢思维模式自由切换能力，标志着国产自研模型在动态推理机制上的重要突破。

作为盘古系列的新成员，该模型通过渐进式微调策略和双阶段训练方法，创新性地构建了自适应思维引擎。技术层面显示，其不仅支持用户手动选择”快思考”（快速响应）或”慢思考”（深度推理）模式，还能基于问题复杂度自动切换处理方式。在CMMLU等基准测试中，模型在保持精度的前提下，将平均思维链长度压缩近50%，显著提升了推理效率。

值得注意的是，这一技术解决了大模型领域长期存在的效率与精度难以兼得的痛点。实际测试表明，面对简单查询时，模型响应速度接近实时；处理数学推导、代码生成等复杂任务时，则自动启用深度推理模式，准确率较前代模型提升显著。这种动态调整机制使得7B小模型在边缘计算场景中展现出媲美更大规模模型的性能。

目前，该模型已在GitCode平台开源，相关技术文档显示其特别适配昇腾系列硬件。业界分析认为，这种可配置的推理架构为资源受限场景下的AI部署提供了新思路，尤其在需要实时交互与复杂决策并存的工业物联网、移动终端等领域具有明确的应用前景。华为盘古团队表示，将持续优化模型的端侧适配能力，推动轻量化大模型的实际落地。

AI产品动态 # AI推理 # openPangu-Embedded # 华为 # 开源大模型 # 昇腾硬件 # 轻量级模型 # 边缘计算

文章版权归作者所有，未经允许请勿转载。

华为开源轻量级大模型openPangu-Embedded-7B-v1.1，实现快慢思维自由切换突破

AirPods Pro 3重磅发布：AI实时翻译+心率监测，重新定义跨语言通话体验

Fellou发布全球首款AI Agent浏览器，多智能体并行协作重塑浏览体验

相关文章

谷歌Gemini CLI扩展框架正式发布：无需审核即可构建AI命令行工具

谷歌为Google Docs推出AI语音朗读功能，支持自定义语音风格与播放速度

VAREdit突破AI图像编辑瓶颈：自回归框架实现0.7秒高保真编辑

科大讯飞AI学习机2025暑期重磅升级：15项新功能引领个性化教育新时代

最新资讯

热门AI工具

热门资讯