Meta发布AI智能体评估平台ARE及Gaia2基准模型,破解真实场景适应性评估难题 Meta推出创新AI智能体评估平台ARE和Gaia2基准模型,解决真实场景适应性评估行业难题。平台采用动态环境模拟技术,在复杂任务中提升决策准确率19.7%,为金融、医疗、智能制造等领域提供标准化性能... AI新闻资讯# AI基准测试# AI智能体# ARE平台 1天前