谷歌AI推出Stax评估工具:重塑大型语言模型性能测试标准 谷歌AI推出Stax工具,提供大型语言模型(LLM)自定义评估功能,支持快速模型比较、结构化测试和灵活指标设计,解决AI输出一致性挑战,推动行业标准化发展。 AI产品动态# AI测试# LLM评估# Stax工具 2天前