英伟达宣布推出新产品Rubin CPX,这是一款专为应对大规模上下文处理而打造的专用GPU,尤其适用于大规模编码和视频生成等高要求任务。
Rubin CPX的设计理念是将AI提示的理解任务与响应生成任务分离,从而显著提升客户的工作效率。作为Vera Rubin平台的一部分,Rubin CPX将与Vera CPU协同工作,全机架版本的Vera Rubin NVL144 CPX更是具备高达8 exaflops的AI性能。
在硬件配置上,独立的Rubin CPX GPU配备了128GB的GDDR7显存,承诺提供3倍的注意力计算能力,并利用4-bit NVFP4精度技术实现30 petaflops的计算性能。英伟达CEO黄仁勋将其与RTX显卡相提并论,强调Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,能够同时处理数百万个知识符号的模型推理。
除了强大的硬件性能,Rubin CPX还得到了英伟达完整软件栈的支持,包括Nemotron系列开放多模态模型。这些模型专为构建企业级AI代理而设计,提供从Nano(设备端应用)到Super(单GPU设置)再到Ultra(大型数据中心)的不同尺寸选择。
英伟达还提到,部署Rubin CPX硬件的1亿美元投资有望产生50亿美元的收益,进一步凸显了其商业价值。据悉,Rubin CPX预计将于2026年底正式推出。 |