Published on2025年9月15日NVIDIA CPX GPU,专门针对推理Prefill与Decode两阶段计算范式优化的硬件AI计算NVIDIANVIDIA CPX GPU,专门针对推理Prefill与Decode两阶段计算范式优化的硬件,整柜方案 Nvidia NVL144 CPX with Rubin CPX ,注意力机制处理速度比 GB300 NVL72 快 3 倍