新一代开源数学定理证明模型Goedel-Prover-V2发布，性能超越前代SOTA

AI新闻资讯11个月前发布 AI视野

近日，由普林斯顿大学牵头，联合清华大学、北京大学、上海交通大学、斯坦福大学及英伟达、亚马逊、Meta FAIR等机构的研究团队正式发布新一代开源数学定理证明模型Goedel-Prover-V2。该模型在自动化数学定理证明领域取得突破性进展，其32B参数版本在多个核心基准测试中显著超越此前最优开源模型DeepSeek-Prover-V2-671B。

技术性能方面，32B旗舰模型在MiniF2F测试集的Pass@32指标上正确率提升8.0%，8B精简版则在特定任务中与671B规模的DeepSeek-Prover-V2表现相当。值得注意的是，新模型在PutnamBench数学竞赛题库中成功解决64道难题，并在国际数学奥林匹克级别的MathOlympiadBench基准上攻克73个问题，较前代SOTA模型DeepSeek-Prover-V2多解决23题。

该模型采用专家迭代训练方法，通过将自然语言数学命题转化为Lean 4等形式化语言，有效缓解了形式化证明数据稀缺的挑战。项目已开源32B和8B双版本模型权重，用户可通过HuggingFace平台获取。初代Goedel-Prover研究成果此前已被COLM 2025顶会收录。

此次发布标志着开源社区在形式化数学推理领域取得重要突破，其小参数模型展现的高效特性，为数学教育辅助工具和科研验证系统的开发提供了新的技术路径。研究团队表示，将持续优化模型在复杂数学命题中的泛化能力。

AI新闻资讯 # AI # Goedel-Prover-V2 # 开源模型 # 数学定理证明 # 普林斯顿大学

文章版权归作者所有，未经允许请勿转载。

新一代开源数学定理证明模型Goedel-Prover-V2发布，性能超越前代SOTA

港科大突破性AI医学影像技术：极低辐射生成高清3D图像，辐射降低99%

Scale AI重组裁员14%：Meta投资后战略转向B端服务，AI数据标注行业面临转型

相关文章

腾讯混元3D创作引擎国际站正式上线，全球用户可免费体验AI 3D建模

AI幻觉危机：ChatGPT集体误判海马emoji事件揭示技术缺陷

优必选完成3.15亿美元融资，创人形机器人领域最大单笔融资纪录

2025中国AI年度榜单评选今日截止申报，12月揭晓五大奖项结果

最新资讯

热门AI工具

热门资讯