商汤科技于2025年11月10日正式开源其空间智能大模型SenseNova-SI系列,包含2B(20亿参数)和8B(80亿参数)两个版本。该系列模型在VSI、MMSI、MindCube和ViewSpatial等空间智能基准测试中表现卓越,其中8B版本以60.99的平均分显著超越同类模型。
技术性能方面,SenseNova-SI-8B不仅领先开源通用多模态模型Qwen3-VL-8B(40.16)和BAGEL-7B(35.01),还超越了闭源模型GPT-5(49.68)与Gemini-2.5-Pro(48.81)。在具体测试案例中,该模型准确识别立方体组合的俯视图(正确答案B),而GPT-5误选D;在SITE-Bench的摩托车方位判断任务中,SenseNova-SI-8B正确判定车辆位于右侧,GPT-5则错误选择左侧。
突破性进展体现在三方面:一是构建”空间能力分类体系”,系统性划分六大核心维度;二是通过大规模数据训练验证”尺度效应”;三是与商汤”开悟”世界模型协同,为自动驾驶、机器人等具身智能应用提供空间理解支持。公司同步开源评测平台EASI,推动行业建立统一评估标准。
此次开源标志着AI在三维空间认知能力上的重要突破,弥补了当前大模型在空间结构理解方面的技术短板。模型已部署于GitHub和Hugging Face平台,开发者可获取完整技术资源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。