OpenAI发布GPT-5系列模型:推理能力突破与争议并存,API成本大幅降低

AI新闻资讯15小时前发布 AI视野

OpenAI于2025年8月8日正式发布GPT-5系列模型,涵盖GPT-5、GPT-5-Mini、GPT-5-Nano及企业专属的GPT-5-Pro版本。此次迭代在推理能力、编程效率及多模态处理上实现技术突破,但公众对其进步幅度的评价呈现两极分化。

核心能力升级与争议
GPT-5采用模块化架构,由基础模型、深度推理子模型(GPT-5-thinking)及实时路由器组成,可根据任务复杂度动态分配计算资源。官方测试数据显示,其编程能力在SWE-bench测试中达74.9%,超越Claude Opus 4.1(74.5%),数学领域AIME无工具测试准确率94.6%。然而,在AGI终极测试中表现逊于Grok 4,多模态能力亦未支持音视频生成,引发部分用户对创新不足的质疑。

关键改进与商业化落地
模型显著降低幻觉率,事实错误率较GPT-4o下降45%,上下文窗口扩展至400K tokens,长文本处理效率提升一倍。定价策略成为亮点:API输入/输出成本分别为每百万token 1.25美元和10美元,低于主流竞品。企业场景中,GPT-5可自动调试代码库并解释修复逻辑,医疗领域在HealthBench Hard测试得分46.2%,创行业新高。

市场反应与生态影响
尽管发布会因数据展示失误(如数学不等式错误)遭调侃,GPT-5的性价比仍推动开发者快速迁移。太平洋证券分析指出,其定价优势或加速AI Agent在金融、教育等场景的渗透。同期华为CANN生态开源与GPT-5形成协同效应,中信建投报告认为,两者将共同拓展多模态应用的工业落地边界。

目前,所有ChatGPT用户均可访问基础版GPT-5,Pro版本需订阅200美元/月服务。OpenAI强调,该模型在47.1%的专业任务中达到人类专家水平,但承认其在复杂创造性任务上仍需突破。

© 版权声明

相关文章