阿里通义千问Qwen3-Max重磅发布：万亿参数模型刷新多项国际纪录

AI产品动态8个月前发布 AI视野

在2025云栖大会开幕式上，阿里巴巴正式推出通义千问旗舰模型Qwen3-Max，标志着其在全球大模型竞赛中迈入第一梯队。该模型包含指令（Instruct）和推理（Thinking）两大版本，总参数规模突破万亿，预训练数据量达36T tokens，成为通义家族中性能最强的基座模型。

性能表现方面，Qwen3-Max在多项国际权威测试中刷新纪录。其Instruct版本在SWE-Bench Verified测试中以69.6分位列全球第一梯队，展现卓越的编程问题解决能力；在Tau2-Bench工具调用测试中更以74.8分超越Claude Opus4和DeepSeek-V3.1。特别值得注意的是，推理增强版Qwen3-Max-Thinking-Heavy在AIME25数学推理和HMMT测试中均获满分，创下国内大模型首次实现双满分的里程碑。

技术突破体现在多模态处理能力上，实测显示该模型可精准生成符合物理规律的流体模拟代码，并能完成SVG图像创作、网页前端开发等复杂任务。相比前代产品，新模型显著降低知识幻觉现象，在LiveBench等抗干扰测试中取得79.3分，证明其输出可靠性大幅提升。

商业化部署已同步启动，用户可通过通义千问QwenChat平台免费体验，开发者则能调用阿里云百炼平台的API服务。计费方案采用阶梯式设计，支持最高256k上下文长度，输入输出费用区间为0.006-0.06元/千token。据观察，模型对中文自然语言理解能力突出，可高效完成代码生成、会议纪要整理等实际场景任务。

此次发布使阿里成为全球首个同时实现万亿参数模型商业化落地和开源生态建设的科技企业，其技术路线验证了参数规模与模型性能的正相关关系，为行业提供重要参考案例。

文章版权归作者所有，未经允许请勿转载。

阿里通义千问Qwen3-Max重磅发布：万亿参数模型刷新多项国际纪录

云天励飞2025年底推出噜咔博士AI毛绒玩具，同步披露新一代人形机器人芯片进展

阿里通义万相Wan2.5发布：实现音画同步AI视频生成，10秒1080P影视级输出

相关文章

谷歌为Google Docs推出AI语音朗读功能，支持自定义语音风格与播放速度

月之暗面开源万亿参数MoE模型Kimi K2，AI领域迎来新旗舰

2025年人工智能等7项国家标准正式发布，助力数字经济标准化建设

阿里巴巴开源32款Qwen3系列MLX模型，全面适配苹果设备生态

最新资讯

热门AI工具

热门资讯