腾讯发布TiG框架:AI战略决策准确率提升超30%,《王者荣耀》实战验证

腾讯近日发布的全新TiG(Think in Games)框架在AI战略决策领域取得突破性进展。该技术以《王者荣耀》为实验平台,成功实现了AI在复杂游戏环境中的思考与行动同步,部分模型的决策准确率提升超过30个百分点。

研究团队针对当前AI领域存在的功能鸿沟展开攻关。传统游戏AI虽能执行操作但缺乏决策解释能力,而语言模型擅长策略推理却难以实时应对动态场景。TiG框架通过两阶段训练机制弥合这一差距:首先利用监督学习掌握40种预定义的宏观游戏行动(如推塔、控龙等),随后采用强化学习中的”10”奖励机制持续优化策略选择。训练数据来自经过匿名处理的真实赛事录像,确保胜负样本均衡。

实验数据显示,经过TiG框架优化的模型展现出显著性能提升。其中Qwen3-14B模型的战略判断准确率达到90.91%,超越对照组DeepSeek-R1的86.67%;Qwen2.5-32B版本准确率从66.67%跃升至86.84%;而Qwen2.5-14B更是实现从53.25%到83.12%的跨越式进步。值得注意的是,这些AI不仅能生成战术指令,还能用自然语言解释决策逻辑,例如分析敌方防御薄弱点或预判埋伏风险。

该技术的创新性体现在群体相对策略优化(GRPO)的应用,通过比较不同策略的优劣关系,既提升了小模型的性能表现,又保障了大模型的稳定性。测试表明,经过专项训练的模型仍保持原有文本理解、数学推理等基础能力。

研究人员指出,TiG框架的价值不仅限于游戏领域。这种”战略推理+可解释决策”的机制,未来可延伸至金融交易、工业调度等需要实时决策解释的场景。目前相关成果已发布于Hugging Face平台和arXiv期刊,标志着AI发展正从单纯追求参数规模,转向更注重因果逻辑与策略思维的深度融合。

© 版权声明

相关文章