Anthropic发布Claude Opus 4.1模型,AI编程与数据分析能力再升级

AI产品动态20小时前发布 AI视野

人工智能领域竞争持续升级,Anthropic于8月6日正式推出Claude Opus 4.1模型,在编程、研究及数据分析能力上实现显著突破。此次更新被视为对OpenAI即将发布的GPT-5的针对性布局,标志着行业技术迭代进入白热化阶段。

技术性能突破
新模型在SWE-bench Verified基准测试中达到74.5%的准确率,较5月发布的Opus 4提升2个百分点,较Sonnet 3.7版本提升12.2个百分点。多文件代码重构能力成为核心亮点,日本乐天集团实测证实其可精准定位大型代码库中的错误修正点,避免无效调整或引入新漏洞。GitHub数据显示,该模型在初级开发人员基准测试中的性能提升幅度相当于从Sonnet 3.7到Sonnet 4的版本跨越。

功能升级方向
Opus 4.1强化了智能体工具调用与多语言问答能力,尤其在细节追踪、代理搜索等深度研究场景表现突出。Anthropic首席产品官Mike Krieger透露,公司战略已转向高频次渐进式优化,而非仅聚焦重大版本更新。目前模型已通过API、Amazon Bedrock和Google Cloud Vertex AI平台开放,定价维持输入15美元/百万token、输出75美元/百万token的标准。

行业竞争态势
此次发布正值OpenAI预告GPT-5上线前夕。第三方评测显示,Opus 4.1在Agentic编码、工具调用等多数基准测试中领先竞品,但在视觉推理与高等数学领域仍逊于OpenAI o3模型。Anthropic同步预告未来数周将推出更大幅度改进,进一步巩固其在专业编程赛道的优势地位。

© 版权声明

相关文章