阿里通义千问发布Qwen3-30B-A3B系列升级版,性能对标GPT-4o

阿里通义千问团队于7月30日至31日连续发布Qwen3-30B-A3B系列模型的两大升级版本,其中Qwen3-30B-A3B-Thinking-2507和Qwen3-30B-A3B-Instruct-2507分别在思考模式与非思考模式下实现技术突破。新版本通过参数效率优化,在仅激活约3B参数的配置下,性能已可对标Gemini 2.5-Flash、GPT-4o等顶尖闭源模型。

核心性能提升
最新发布的Qwen3-30B-A3B-Thinking-2507在AIME25数学评测中获得85.0分,LiveCodeBenchv6代码测试得分达66.0,两项成绩均超越前代Qwen3-235B-A22B(thinking)及竞品Gemini2.5-Flash。模型在GPQA和MMLU-Pro知识评测中的进步尤为显著,其256K tokens原生上下文窗口可扩展至1M,为复杂推理任务提供更长的思考预算支持。通用能力方面,新模型在写作、智能代理、多轮对话及多语言指令遵循等场景表现突出。

技术架构创新
Qwen3-30B-A3B-Instruct-2507版本通过动态参数激活机制,实现3B有效参数下的高性能输出。该设计大幅降低计算资源需求,使模型可在消费级硬件部署。对比4月发布的Qwen3-30-A3B基础版,新版本长文本处理能力提升至256K tokens,推理效率提高40%,显存占用仅为同类模型的三分之一。

开源生态布局
目前两款新模型已在魔搭社区和HuggingFace平台开源,同步上线QwenChat应用平台。开发者可通过4张H20显卡完成本地部署,阿里云百炼平台同时提供API调用服务。团队强调,此次升级延续Apache2.0开源协议,支持119种语言处理,为企业级应用和学术研究提供更高效的工具支持。

行业观察指出,此次迭代标志着通义千问在参数效率与性能平衡方面取得关键进展,为AI模型轻量化部署树立新标杆。随着技术门槛的降低,预计将加速智能客服、金融分析、跨语言服务等领域的应用落地。

© 版权声明

相关文章