Anthropic于2025年11月25日正式发布旗舰AI模型Claude Opus 4.5,该版本在编程能力、智能体协作及多任务处理方面实现显著突破,同时大幅下调服务定价,引发行业广泛关注。
技术性能全面升级
新模型在权威软件工程基准测试SWE-bench Verified中取得80.9%的准确率,超越OpenAI的GPT-5.1-Codex-Max(77.9%)、谷歌Gemini 3 Pro(76.2%)及自家前代产品Sonnet 4.5(77.2%)。其突出表现为:
1. 编程能力:在Anthropic内部设计的工程师入职测试中,Opus 4.5首次超越所有人类候选者成绩,该测试要求两小时内完成高难度技术任务,重点考察逻辑判断与执行效率;
2. 智能体协作:新增长周期任务自主处理功能,支持30小时以上连续编码与调试,并引入检查点(Checkpoints)机制以提升容错性;
3. 多模态应用:优化对Excel、PPT等办公软件的交互能力,例如在模拟航空客服的τ2-bench测试中,模型能灵活结合政策规则提出创新解决方案。
定价策略调整
Opus 4.5的API费用降至输入5美元/百万Token、输出25美元/百万Token,较前代Opus 4.1(输入15美元/输出75美元)降幅达三分之二。这一调整显著降低企业使用门槛,同时向个人开发者开放基础版免费额度(含次数限制)。
生态整合与行业影响
模型已通过Claude应用、API及主流云平台全球上线,配套更新开发者工具链,包括:
– 桌面端Claude Code支持多会话并行处理;
– 企业用户可直接在Excel中调用模型功能;
– 取消长对话长度限制,系统自动摘要历史内容以维持上下文连贯性。
行业分析指出,此次发布将进一步加剧AI领域竞争,尤其在金融、医疗等高可靠性需求场景中,Anthropic凭借完整产品矩阵(Opus/Sonnet/Haiku系列)巩固技术优势。宾夕法尼亚大学沃顿商学院教授伊桑·莫利克评价称,Opus 4.5展现的“情境理解力”标志着AI从工具向协作伙伴的转变。
© 版权声明
文章版权归作者所有,未经允许请勿转载。