商汤科技开源空间智能大模型SenseNova-SI系列，8B版本性能超越GPT-5

AI产品动态7个月前发布 AI视野

商汤科技于2025年11月10日正式开源其空间智能大模型 SenseNova-SI系列，包含2B（20亿参数）和8B（80亿参数）两个版本。该系列模型在VSI、MMSI、MindCube和ViewSpatial等空间智能基准测试中表现卓越，其中8B版本以60.99的平均分显著超越同类模型。

技术性能方面，SenseNova-SI-8B不仅领先开源通用多模态模型Qwen3-VL-8B（40.16）和BAGEL-7B（35.01），还超越了闭源模型GPT-5（49.68）与Gemini-2.5-Pro（48.81）。在具体测试案例中，该模型准确识别立方体组合的俯视图（正确答案B），而GPT-5误选D；在SITE-Bench的摩托车方位判断任务中，SenseNova-SI-8B正确判定车辆位于右侧，GPT-5则错误选择左侧。

突破性进展体现在三方面：一是构建”空间能力分类体系”，系统性划分六大核心维度；二是通过大规模数据训练验证”尺度效应”；三是与商汤”开悟”世界模型协同，为自动驾驶、机器人等具身智能应用提供空间理解支持。公司同步开源评测平台EASI，推动行业建立统一评估标准。

此次开源标志着AI在三维空间认知能力上的重要突破，弥补了当前大模型在空间结构理解方面的技术短板。模型已部署于GitHub和Hugging Face平台，开发者可获取完整技术资源。

文章版权归作者所有，未经允许请勿转载。

商汤科技开源空间智能大模型SenseNova-SI系列，8B版本性能超越GPT-5

OpenAI正式进军云计算市场！斥资1.4万亿美元挑战AWS、Azure三巨头

字节跳动发布豆包编程模型：国内首款支持视觉理解的编程AI，成本降低62.7%

相关文章

特斯拉Optimus实验室跑步视频曝光，人形机器人动态平衡技术获突破

上体体育大模型2.0重磅发布：AI技术赋能体育产业，助力奥运备战与全民健康

字节跳动豆包AI助手推出可视化编程功能，零基础用户也能轻松开发应用

OpenAI推出ChatGPT记忆自动管理功能，彻底解决内存已满问题

最新资讯

热门AI工具

热门资讯