谷歌旗下DeepMind实验室于2025年11月14日正式推出第二代可扩展可指令多世界智能体SIMA 2,该系统在复杂游戏环境中的任务执行成功率较前代提升近一倍,标志着通用人工智能研发取得关键突破。该智能体基于Gemini 2.5 Flash-lite架构构建,已实现65%的复杂指令完成率,接近人类玩家75%的基准水平。
技术架构方面,SIMA 2创新性地引入自生成数据闭环系统。当进入《无人深空》《山羊模拟器3》等未训练过的游戏场景时,系统自动调用独立Gemini模型生成多样化任务,通过内置奖励机制筛选优质行为轨迹用于持续微调。这种无监督学习机制使其能解析环境文本、识别颜色符号等视觉信息,甚至可执行由emoji组合构成的抽象指令。在演示中,智能体成功完成”前往红色建筑”“砍伐树木”等跨游戏复杂操作,并能用自然语言解释决策过程。
研究团队特别强调,SIMA 2首次实现”环境感知-目标推断-动作规划”的完整认知闭环。通过结合生成式世界模型Genie,智能体在动态生成的户外场景中准确识别长椅、树木等对象并完成交互。这种高层级推理能力被视为虚拟智能体向实体机器人迁移的核心技术模块。目前该系统仍专注于决策层开发,暂未集成底层运动控制功能。
DeepMind首席执行官Demis Hassabis表示,SIMA系列研发是通向通用人工智能的重要路径。相较于2024年3月发布的初代产品仅31%的任务完成率,新一代系统通过融合大语言模型的语义理解能力,已实现从机械执行到自主思考的质变。该技术预计将率先应用于游戏辅助、虚拟培训等领域,其长期目标是为物理世界机器人建立可迁移的认知框架。
© 版权声明
文章版权归作者所有,未经允许请勿转载。