OpenAI发布GPT-5系列模型:编程与多模态能力实现突破性进展

AI产品动态8小时前发布 AI视野

OpenAI于2025年8月8日正式发布的GPT-5系列模型,凭借其卓越的编程与多模态能力引发行业广泛关注。该系列包含GPT-5、GPT-5mini和GPT-5nano三款模型,其中旗舰版本GPT-5 Pro在编程解题与图像识别领域展现出突破性进展。

编程能力方面,GPT-5 Pro实现了单轮提示词完成全功能开发的突破。公开演示显示,该模型仅用1分钟即完成包含交互逻辑的3D小游戏开发,并能自动修复代码错误。值得注意的是,其代码生成系统新增”计划解释”功能,可实时向开发者说明实现逻辑与调试步骤。对于复杂代码库的维护,GPT-5 Pro展现出处理”遗留代码”(即业界俗称的”屎山代码”)的独特能力,能精准识别无关修改点,避免引入新问题。

图像识别领域,GPT-5 Pro在标准测试中实现数独题目的秒级解析,对钟表时间的识别准确率达99.7%。虽然仍不支持视频输入和图像生成,但其多模态处理速度较前代提升300%。在物理教学演示中,模型可根据”伯努利效应”的抽象概念,实时生成包含SVG动画的交互式网页,动态展示机翼升力变化。

价格策略方面,基础版GPT-5向网页端用户免费开放,Pro版本通过200美元/月的订阅制提供服务。API调用成本显著降低,输入/输出价格分别为每百万token 1.25美元和10美元。性能测评机构ArtificialAnalysis数据显示,GPT-5综合能力已超越Grok4位列榜首。

OpenAI首席执行官萨姆·奥尔特曼在发布会上强调,这是通向人工通用智能(AGI)的关键里程碑。不过业界也注意到,该模型在数学严谨性方面存在瑕疵,演示环节曾出现”52.8>69.1=30.8”的公式错误。目前模型正分批向全球用户推送,预计未来一周内完成全量覆盖。

© 版权声明

相关文章