Anthropic发布Claude Opus 4.1模型，AI编程与数据分析能力再升级

人工智能领域竞争持续升级，Anthropic于8月6日正式推出Claude Opus 4.1模型，在编程、研究及数据分析能力上实现显著突破。此次更新被视为对OpenAI即将发布的GPT-5的针对性布局，标志着行业技术迭代进入白热化阶段。

技术性能突破
新模型在SWE-bench Verified基准测试中达到74.5%的准确率，较5月发布的Opus 4提升2个百分点，较Sonnet 3.7版本提升12.2个百分点。多文件代码重构能力成为核心亮点，日本乐天集团实测证实其可精准定位大型代码库中的错误修正点，避免无效调整或引入新漏洞。GitHub数据显示，该模型在初级开发人员基准测试中的性能提升幅度相当于从Sonnet 3.7到Sonnet 4的版本跨越。

功能升级方向
Opus 4.1强化了智能体工具调用与多语言问答能力，尤其在细节追踪、代理搜索等深度研究场景表现突出。Anthropic首席产品官Mike Krieger透露，公司战略已转向高频次渐进式优化，而非仅聚焦重大版本更新。目前模型已通过API、Amazon Bedrock和Google Cloud Vertex AI平台开放，定价维持输入15美元/百万token、输出75美元/百万token的标准。

行业竞争态势
此次发布正值OpenAI预告GPT-5上线前夕。第三方评测显示，Opus 4.1在Agentic编码、工具调用等多数基准测试中领先竞品，但在视觉推理与高等数学领域仍逊于OpenAI o3模型。Anthropic同步预告未来数周将推出更大幅度改进，进一步巩固其在专业编程赛道的优势地位。

文章版权归作者所有，未经允许请勿转载。

Anthropic发布Claude Opus 4.1模型，AI编程与数据分析能力再升级

谷歌Gemini AI推出Storybook功能：将文字和草图转化为定制化故事书

北京人形机器人创新中心发布“Humanoid Occupancy”视觉感知系统，推动具身智能机器人技术突破

相关文章

英伟达Blackwell架构中国特供版B30A芯片9月送样，算力超H50%但存监管变数

昆仑万维发布Mureka V7音乐生成模型：AI音乐创作技术迎来重大突破

谷歌Gmail推出“管理订阅”新功能，AI助力高效清理收件箱

腾讯元宝AI高考志愿咨询免费服务，助力考生精准填报志愿

最新资讯

热门AI工具

热门资讯