阿里通义千问Qwen3-Max重磅发布:万亿参数模型刷新多项国际纪录

在2025云栖大会开幕式上,阿里巴巴正式推出通义千问旗舰模型Qwen3-Max,标志着其在全球大模型竞赛中迈入第一梯队。该模型包含指令(Instruct)和推理(Thinking)两大版本,总参数规模突破万亿,预训练数据量达36T tokens,成为通义家族中性能最强的基座模型。

性能表现方面,Qwen3-Max在多项国际权威测试中刷新纪录。其Instruct版本在SWE-Bench Verified测试中以69.6分位列全球第一梯队,展现卓越的编程问题解决能力;在Tau2-Bench工具调用测试中更以74.8分超越Claude Opus4和DeepSeek-V3.1。特别值得注意的是,推理增强版Qwen3-Max-Thinking-Heavy在AIME25数学推理和HMMT测试中均获满分,创下国内大模型首次实现双满分的里程碑。

技术突破体现在多模态处理能力上,实测显示该模型可精准生成符合物理规律的流体模拟代码,并能完成SVG图像创作、网页前端开发等复杂任务。相比前代产品,新模型显著降低知识幻觉现象,在LiveBench等抗干扰测试中取得79.3分,证明其输出可靠性大幅提升。

商业化部署已同步启动,用户可通过通义千问QwenChat平台免费体验,开发者则能调用阿里云百炼平台的API服务。计费方案采用阶梯式设计,支持最高256k上下文长度,输入输出费用区间为0.006-0.06元/千token。据观察,模型对中文自然语言理解能力突出,可高效完成代码生成、会议纪要整理等实际场景任务。

此次发布使阿里成为全球首个同时实现万亿参数模型商业化落地和开源生态建设的科技企业,其技术路线验证了参数规模与模型性能的正相关关系,为行业提供重要参考案例。

© 版权声明

相关文章