近日,上海人工智能实验室(Shanghai AI Lab)与浙江大学EagleLab联合团队在人工智能领域取得重要突破,提出了一种名为RRVF(Reinforced Reasoning with Visual Feedback)的创新方法,通过验证非对称性原理显著提升了AI系统的视觉推理能力。这项研究为验证者法则(Verifier’s Law)提供了实证支持,揭示了未来AI发展的关键路径。
研究团队由上海AI Lab前沿探索中心石博天研究员领衔,浙江大学硕士生陈杨(第一作者)、上海AI Lab研究员沈宇帆(共同第一作者兼通讯作者)以及浙江大学于智副教授(共同通讯作者)等组成。值得注意的是,该成果是陈杨在上海AI Lab实习期间完成,其所在团队专注于构建”提取-结构化-推理”全链路智能系统,涵盖多模态大模型与自主智能体等前沿方向。
核心创新点在于利用”验证非对称性”原理——即验证解决方案的正确性远比生成解决方案简单。实验证明,RRVF模型仅需输入图片即可学习视觉到代码的生成逻辑,且执行率保持97.83%至96.21%的稳定水平。这种通过视觉反馈强化的学习机制,使AI系统能够掌握可迁移的底层推理能力,而非简单的模式匹配。
研究结果印证了前OpenAI研究员Jason Wei提出的验证者法则:”所有可能被解决且易于验证的任务,都将被AI解决。”团队指出,未来AI发展的瓶颈不在于模型规模,而在于能否将复杂问题转化为可验证的形式。当人类设计出高效的验证环境时,AI将在可验证领域展现出”锯齿状前沿”式的突破性进展。
该研究同时体现了学术界的交叉合作价值,浙江大学EagleLab在算法优化、上海创智学院在工程实现方面均作出重要贡献。于智副教授团队长期致力于AI赋能残障人群的实践,也为本项研究注入了人文关怀的维度。目前相关技术细节已通过学术论文公开,为多模态大模型的发展提供了新思路。
© 版权声明
文章版权归作者所有,未经允许请勿转载。