微软Azure与英伟达Blackwell Ultra GPU实现每秒110万token AI推理新纪录 微软Azure与英伟达合作推出基于Blackwell Ultra GPU的虚拟机,在Llama2 70B模型上实现每秒110万token推理速度,性能提升27%,能效优化2.5倍,为企业级AI部署设立... AI产品动态# AI推理# BlackwellUltra# Llama2 12小时前