英伟达GB300 NVL72平台横扫MLPerf测试,AI训练效率实现数量级突破

在最新一轮的MLPerf AI训练基准测试中,英伟达基于Blackwell Ultra架构的GB300 NVL72平台以颠覆性表现包揽全部7项测试冠军,标志着AI算力进入全新里程碑。该平台在训练4050亿参数的Llama 3.1大模型时仅耗时10分钟,较传统方案实现数量级突破。

性能测试数据显示,GB300 NVL72在关键任务中展现出惊人效率:完成Llama 2 70B模型的LoRA微调仅需0.4分钟,训练80亿参数的Llama 3.1 8B模型仅消耗5.2分钟。与上一代H100 GPU对比,8块GB300 GPU在Llama 2 70B微调任务中性能提升达5倍;在4050亿参数预训练任务中,其性能超越H100四倍以上,较同架构GB200平台提速近两倍。

这一突破源于软硬件的协同创新。硬件层面,系统集成800GB/s速率的Quantum-X800 InfiniBand网络,每块GPU配备279GB HBM3e内存,系统总内存容量达40TB。软件方面,全面采用FP4精度计算,通过Blackwell Ultra架构将计算速度提升至FP8精度的三倍。微软Azure已率先部署该平台,其ND GB300 v6虚拟机在推理测试中创下每秒110万token的新纪录。

此次测试结果验证了Blackwell Ultra架构的领先性,为超大规模AI模型训练树立了新基准。该技术突破将显著加速生成式AI、科学计算等领域的应用落地,推动AI基础设施进入新的发展阶段。

© 版权声明

相关文章