阿里通义千问发布两款轻量化开源AI模型，推动端侧AI技术普及

AI产品动态8个月前发布 AI视野

8月7日，阿里巴巴集团旗下通义千问团队宣布推出两款专为端侧设备优化的小尺寸开源模型——Qwen3-4B-Instruct-2507与Qwen3-4B-Thinking-2507。此次发布标志着国产大模型在轻量化部署领域取得重要突破，两款新模型已同步上线魔搭社区和HuggingFace平台。

技术性能方面，Qwen3-4B-Instruct-2507在非推理任务中展现出显著优势，其综合表现超越闭源竞品GPT4.1-Nano；而Qwen3-4B-Thinking-2507在逻辑推理任务中达到与中等规模模型Qwen3-30B-A3B相当的精度水平。这种性能突破源于阿里云在模型架构上的创新优化，包括采用改进的RoPE位置编码技术和FP32精度的逆频率矩阵处理。

此次发布延续了通义千问”全尺寸、全模态”的开源战略。自2023年启动开源计划以来，该团队已推出参数规模从5亿至1100亿不等的系列模型，形成覆盖端侧、企业级及科研场景的完整技术矩阵。最新数据显示，通义开源模型累计下载量已突破700万次，其中小尺寸模型特别适合移动终端、物联网设备等资源受限环境的AI应用部署。

市场观察人士指出，此次轻量化模型的推出将加速大模型技术在智能终端设备的普及。据行业报告显示，端侧AI市场规模预计在2025年达到千亿级，阿里此次技术布局有望为国产AI生态开辟新的商业化路径。目前，通义系列模型已成功应用于PC、智能手机及智能汽车等多个领域，其开源策略持续降低企业使用大模型的技术门槛。

文章版权归作者所有，未经允许请勿转载。

阿里通义千问发布两款轻量化开源AI模型，推动端侧AI技术普及

MiniMax发布新一代语音生成模型Speech 2.5，实现多语种自然表达与音色复刻技术突破

谷歌Gemini推出引导式学习功能，AI辅导教师助力STEM学习效率提升23%

相关文章

OpenAI联手Etsy/Shopify推出ChatGPT即时结账功能，AI电商新时代开启

Waymo集成Gemini AI助手，无人驾驶出租车服务迎来智能交互新突破

香港城大与华为联合开源低成本视频生成模型Pusa V1.0，训练成本仅500美元

昆仑万维发布Skywork Deep Research Agent v2，AI Office领域再突破

最新资讯

热门AI工具

热门资讯