英特尔Gaudi3与英伟达B200混合AI方案亮相OCP峰会,推理效率提升70%

AI产品动态22小时前发布 AI视野

在2025年OCP全球峰会上,英特尔展示了其最新研发的Gaudi3与英伟达B200混合型AI机架解决方案,旨在通过异构计算架构提升大模型推理效率。该方案将英特尔Gaudi3 AI加速器与英伟达Blackwell架构B200 GPU协同部署,通过任务分工实现性能优化:B200负责推理任务的预填充阶段,Gaudi3则专注于解码阶段。实测数据显示,在Llama开源模型上,该混合方案相比纯B200同构方案可实现最高70%的总拥有成本(TCO)性能增益。

技术架构方面,每个计算托盘集成两颗英特尔Xeon CPU、四颗Gaudi3加速芯片、四张网卡及一颗英伟达BlueField-3 DPU,整机架包含16个此类计算单元。网络层采用英伟达ConnectX-7 400GbE网卡与博通Tomahawk 5 51.2Tb/s交换机,构建全互联拓扑以支持大规模扩展。这种设计既保留了B200在矩阵运算上的优势,又发挥了Gaudi3在序列处理方面的特长,同时通过英伟达生态系统增强了互操作性。

市场分析指出,此次合作标志着英特尔在AI加速器领域的战略调整。自2024年4月发布以来,Gaudi3面临库存积压压力,此次通过融入英伟达主导的Blackwell生态,英特尔试图以互补者角色提升产品竞争力。该混合方案特别针对机架级AI部署场景,强调在保持成本效益的同时突破性能瓶颈,为数据中心客户提供新的异构计算选择。

© 版权声明

相关文章