阿里通义千问发布两款轻量化开源AI模型,推动端侧AI技术普及

8月7日,阿里巴巴集团旗下通义千问团队宣布推出两款专为端侧设备优化的小尺寸开源模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507。此次发布标志着国产大模型在轻量化部署领域取得重要突破,两款新模型已同步上线魔搭社区和HuggingFace平台。

技术性能方面,Qwen3-4B-Instruct-2507在非推理任务中展现出显著优势,其综合表现超越闭源竞品GPT4.1-Nano;而Qwen3-4B-Thinking-2507在逻辑推理任务中达到与中等规模模型Qwen3-30B-A3B相当的精度水平。这种性能突破源于阿里云在模型架构上的创新优化,包括采用改进的RoPE位置编码技术和FP32精度的逆频率矩阵处理。

此次发布延续了通义千问”全尺寸、全模态”的开源战略。自2023年启动开源计划以来,该团队已推出参数规模从5亿至1100亿不等的系列模型,形成覆盖端侧、企业级及科研场景的完整技术矩阵。最新数据显示,通义开源模型累计下载量已突破700万次,其中小尺寸模型特别适合移动终端、物联网设备等资源受限环境的AI应用部署。

市场观察人士指出,此次轻量化模型的推出将加速大模型技术在智能终端设备的普及。据行业报告显示,端侧AI市场规模预计在2025年达到千亿级,阿里此次技术布局有望为国产AI生态开辟新的商业化路径。目前,通义系列模型已成功应用于PC、智能手机及智能汽车等多个领域,其开源策略持续降低企业使用大模型的技术门槛。

© 版权声明

相关文章