中科院SolidGeo基准揭示MLLM立体几何推理短板,最优模型准确率不足50% 中科院最新SolidGeo基准测试显示:主流多模态大语言模型在立体几何推理任务中平均准确率不足50%,较人类水平差距达28%。研究深入分析3113道三维几何问题,揭示MLLM在空间折叠、多图推理等复杂... AI新闻资讯# SolidGeo基准# 中科院研究# 人工智能 4天前