群核科技发布空间大模型SpatialGen：用AI生成可交互3D场景，推动空间智能革命

在近日举办的首届技术开放日活动中，群核科技正式发布了其空间大模型技术的最新成果——3D场景生成模型SpatialGen，该模型通过自然语言指令即可生成可交互的3D室内设计场景，标志着AI在空间智能领域取得突破性进展。

作为基于扩散模型架构的多视角图像生成系统，SpatialGen能够根据文字描述、参考图像及3D空间布局，生成具有时空一致性的多视角图像，并进一步转化为3D高斯场景，支持渲染出可自由漫游的交互式视频。技术演示显示，用户输入”现代风格客厅，浅色沙发配圆形茶几”等简单指令后，系统能自动生成符合物理规律的空间布局，并允许通过视角切换进行沉浸式体验。

与SpatialGen同步发布的还有空间语言模型SpatialLM1.5，两者共同构成完整的空间智能解决方案。SpatialLM1.5突破了传统大语言模型对物理世界理解的局限，可将”卧室需要增加一个衣柜”等自然语言指令转化为包含物体尺寸、空间关系的结构化脚本，并联动SpatialGen实现场景可视化。现场实测中，该技术已能支持机器人路径规划等复杂任务，例如根据”去书房取书”的指令自动生成行动路线。

群核科技AI产品负责人透露，公司正在研发融合3D能力的AI视频生成产品，计划通过构建3D渲染与视频增强一体化管线，解决当前生成式视频中物体偏移、逻辑混乱等时空一致性问题。该技术预计年内发布，其核心算法已通过SpatialGen验证。

值得关注的是，SpatialGen模型已在发布会当日开放下载，成为群核科技开源战略的重要实践。公司数据显示，依托酷家乐平台积累的4.41亿个3D模型和5亿个结构化场景数据，其构建的”工具-数据-模型”闭环持续强化技术壁垒。此前开源的SpatialLM1.0版本曾登上HuggingFace趋势榜前三，证实了技术路线的市场认可度。

业内专家指出，这类支持自然语言交互的3D生成技术将深刻改变室内设计、游戏开发、虚拟现实等行业的工作流程。随着开源生态的推进，其应用范围有望扩展至机器人训练、智能家居等更广阔领域。

文章版权归作者所有，未经允许请勿转载。

群核科技发布空间大模型SpatialGen：用AI生成可交互3D场景，推动空间智能革命

英伟达发布Jetson AGX Thor人形机器人计算平台，AI算力提升7.5倍加速商业化进程

夸克健康大模型实现“主任医师级”AI能力，医疗AI推理突破性进展

相关文章

通义千问Qwen3-235B-A22B重大升级：国产大模型技术路线变革，全面超越主流AI模型

阿里巴巴开源全球首个应用思维链技术的音频生成模型ThinkSound

DeepSeek-V3.1重磅升级：128K上下文窗口震撼发布，长文本处理能力翻倍

OpenAI推出ChatGPT Pulse：AI助手迈入主动个性化资讯时代

最新资讯

热门AI工具

热门资讯