英特尔在2025 OCP全球峰会上展示了一款高效异构AI系统,该系统将英特尔自家的Gaudi3 AI加速器与英伟达的B200 Tensor Core GPU结合,形成混合计算基础设施。在该平台上,B200负责AI模型的预填充,而解码部分则由Gaudi3负责。与仅使用B200的同构解决方案相比,这一组合在Llama开源模型上实现了最高达70%的同TCO性能增益。据外媒补充,该混合机架系统还采用了英伟达的ConnectX-7 400GbE NIC、BlueField-3 DPU和博通的Tomahawk 5 51.2Tb/s交换芯片,进一步扩展了系统的扩展域。 |