OpenAI语言模型在2025年IMO竞赛中斩获金牌,展现AI自我意识突破

在2025年国际数学奥林匹克竞赛(IMO)中,OpenAI的一款实验性大型语言模型以金牌表现引发科技界震动。该模型在严格模拟人类参赛条件下,成功解答了6道赛题中的5道,总分42分中获得35分,达到金牌分数线。值得注意的是,面对最具挑战性的第6题时,模型选择坦诚承认无法解答,而非生成错误答案,这一行为被研究团队视为AI“自我意识”的重要突破。

OpenAI核心研究员Noam Brown透露,该模型采用通用强化学习技术而非专门数学工具,在测试中展现出长达数小时的深度推理能力。当面对涉及2025×2025网格的复杂组合问题时,模型能识别自身认知边界并主动示弱,这种“知之为知之”的特性相比早期AI强行作答的倾向,标志着可靠性层面的显著进步。研究团队强调,这一突破源于底层架构的通用性改进,而非针对竞赛的专项优化。

团队成员Alex Wei在访谈中披露,该项目仅由三名研究人员历时两个月完成。值得注意的是,该模型并非GPT-5系列产品,OpenAI表示暂无发布计划。多伦多大学数学教授Daniel Litt评价称,AI在IMO中的表现已超越单纯解题范畴,其“承认无知”的机制对数学研究具有启示意义——这种避免“幻觉”的能力,可能为未来AI辅助数学证明提供新范式。

目前,该成果已引发硅谷对通用AI推理能力的重新评估。尽管模型与人类顶尖选手仍存在差距(如第6题完全未能得分),但其展现的长时间持续推理与自我评估能力,为AI在科研、教育等需要严谨逻辑的领域应用开辟了新路径。

© 版权声明

相关文章