发帖
客户端
扫码下载

[电脑] 英伟达推出Rubin CPX GPU:专为大规模上下文AI设计,性能强劲

[复制链接]
7 |0
黑芝麻H 发表于 10 小时前 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
英伟达宣布推出新产品Rubin CPX,这是一款专为应对大规模上下文处理而打造的专用GPU,尤其适用于大规模编码和视频生成等高要求任务。

Rubin CPX的设计理念是将AI提示的理解任务与响应生成任务分离,从而显著提升客户的工作效率。作为Vera Rubin平台的一部分,Rubin CPX将与Vera CPU协同工作,全机架版本的Vera Rubin NVL144 CPX更是具备高达8 exaflops的AI性能。

在硬件配置上,独立的Rubin CPX GPU配备了128GB的GDDR7显存,承诺提供3倍的注意力计算能力,并利用4-bit NVFP4精度技术实现30 petaflops的计算性能。英伟达CEO黄仁勋将其与RTX显卡相提并论,强调Rubin CPX是首款专为大规模上下文AI设计的CUDA GPU,能够同时处理数百万个知识符号的模型推理。

除了强大的硬件性能,Rubin CPX还得到了英伟达完整软件栈的支持,包括Nemotron系列开放多模态模型。这些模型专为构建企业级AI代理而设计,提供从Nano(设备端应用)到Super(单GPU设置)再到Ultra(大型数据中心)的不同尺寸选择。

英伟达还提到,部署Rubin CPX硬件的1亿美元投资有望产生50亿美元的收益,进一步凸显了其商业价值。据悉,Rubin CPX预计将于2026年底正式推出。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表