在近日举办的首届技术开放日活动中,群核科技正式发布了其空间大模型技术的最新成果——3D场景生成模型SpatialGen,该模型通过自然语言指令即可生成可交互的3D室内设计场景,标志着AI在空间智能领域取得突破性进展。
作为基于扩散模型架构的多视角图像生成系统,SpatialGen能够根据文字描述、参考图像及3D空间布局,生成具有时空一致性的多视角图像,并进一步转化为3D高斯场景,支持渲染出可自由漫游的交互式视频。技术演示显示,用户输入”现代风格客厅,浅色沙发配圆形茶几”等简单指令后,系统能自动生成符合物理规律的空间布局,并允许通过视角切换进行沉浸式体验。
与SpatialGen同步发布的还有空间语言模型SpatialLM1.5,两者共同构成完整的空间智能解决方案。SpatialLM1.5突破了传统大语言模型对物理世界理解的局限,可将”卧室需要增加一个衣柜”等自然语言指令转化为包含物体尺寸、空间关系的结构化脚本,并联动SpatialGen实现场景可视化。现场实测中,该技术已能支持机器人路径规划等复杂任务,例如根据”去书房取书”的指令自动生成行动路线。
群核科技AI产品负责人透露,公司正在研发融合3D能力的AI视频生成产品,计划通过构建3D渲染与视频增强一体化管线,解决当前生成式视频中物体偏移、逻辑混乱等时空一致性问题。该技术预计年内发布,其核心算法已通过SpatialGen验证。
值得关注的是,SpatialGen模型已在发布会当日开放下载,成为群核科技开源战略的重要实践。公司数据显示,依托酷家乐平台积累的4.41亿个3D模型和5亿个结构化场景数据,其构建的”工具-数据-模型”闭环持续强化技术壁垒。此前开源的SpatialLM1.0版本曾登上HuggingFace趋势榜前三,证实了技术路线的市场认可度。
业内专家指出,这类支持自然语言交互的3D生成技术将深刻改变室内设计、游戏开发、虚拟现实等行业的工作流程。随着开源生态的推进,其应用范围有望扩展至机器人训练、智能家居等更广阔领域。
© 版权声明
文章版权归作者所有,未经允许请勿转载。