亚马逊云科技近日正式推出两款基于NVIDIA Blackwell架构的GPU实例——Amazon EC2 P6e-GB200 UltraServer和Amazon EC2 P6-B200,进一步强化其AI基础设施能力。此次发布标志着云计算平台在支持大规模AI模型训练与推理领域的技术突破。
旗舰级产品P6e-GB200 UltraServer采用NVIDIA Grace Blackwell Superchips加速方案,单台服务器最高集成72个Blackwell GPU,通过第五代NVLink实现GPU间高速互连,形成统一计算单元。该配置可提供360 petaflops的FP8算力峰值,并配备13.4TB HBM3e高带宽显存。性能测试显示,其计算能力较前代P5en实例提升超20倍,内存容量增长11倍,同时支持28.8 Tbps的第四代弹性结构适配器网络带宽。
针对多样化AI工作负载需求,同步推出的P6-B200实例采用8个NVLink互连的Blackwell GPU,配备1.4TB显存和3.2 Tbps网络带宽,搭载第五代Intel Xeon可扩展处理器。相比前代产品,其GPU计算性能提升2.25倍,显存带宽增加1.6倍,特别适合药物研发、企业级AI应用等场景。
亚马逊云科技计算与机器学习服务副总裁David Brown表示,新实例将显著加速生成式AI技术的商业化进程,特别是在处理万亿参数大模型时展现出突破性效率。目前客户可通过标准化部署流程快速接入Blackwell计算资源,现有运维体系无需重大调整。
此次发布延续了亚马逊云科技与NVIDIA的深度合作,此前双方曾于2024年GTC大会宣布Blackwell平台登陆云服务的计划。行业分析指出,随着Blackwell系列GPU的规模化部署,超大规模AI模型的训练成本与周期有望实现数量级优化。
© 版权声明
文章版权归作者所有,未经允许请勿转载。