Rubin CPX与全新 NVIDIA Vera Rubin NVL144 CPX 平台中的 Vera CPU、Rubin GPU 协同运作,单一机架具备高达 8 exaflops AI 运算能力,比 GB300 NVL72 系统效能提升 7.5 倍,并配备 100TB 快速记忆体与 每秒 1.7PB 记忆体频宽。同时,NVIDIA 也提供专属运算托盘,方便现有客户升级。
NVIDIA 创办人暨执行长黄仁勋指出,Rubin CPX 是首款专为长情境 AI 打造的 CUDA GPU,如同当年 RTX 改变图形运算,Rubin CPX 将彻底改写 AI 模型推理方式,能处理数百万词元的任务。这项技术突破将让 AI 从单纯生成程式码,演进为可理解并最佳化大型软体系统的工具。
Rubin CPX 将影片解码器、编码器与长情境推论处理技术整合至单一晶片,解决传统 GPU 无法承受的百万词元瓶颈。这对影片搜寻、长格式生成与动态影像分析等应用带来全新可能。NVIDIA 表示,Rubin CPX 可在处理长情境时提供最高词元收益与效能,为 AI 助理、影片生成与多模态代理奠定基础。
该 GPU 采 单晶片 Rubin 架构,搭载 NVFP4 运算资源,效能可达 30 petaflops,并配置 128GB GDDR7 记忆体,大幅提升能源效率与经济性。与 GB300 NVL72 相比,Rubin CPX 能将系统专注力提升 3 倍,让模型在不牺牲速度下处理更长的情境序列。
Rubin CPX 提供多种平台组合,包含 InfiniBand 横向扩展架构与 Spectrum-X 乙太网路平台。官方估算,企业透过 Rubin CPX,每投资 1 亿美元可获得 50 亿美元词元收益。
Rubin CPX 将获得 NVIDIA AI 技术堆叠全面支援,包括 NVIDIA Dynamo 平台、Nemotron 多模态模型、AI Enterprise 软体平台与 NIM 微服务。NVIDIA 表示,企业可将 Rubin CPX 应用于云端、资料中心与工作站,支援最先进的推理与生成工作负载。
Rubin 平台延续 CUDA 生态优势,结合 600 万名开发者社群与 6,000 种 CUDA 应用,扩大 GPU 在长情境 AI、影片生成与软体工程的核心地位。NVIDIA 强调,Rubin CPX 不仅是一款 GPU,更是推动「长情境 AI 时代」的全新处理器类别。
