arzh-CNenfrdejakoplptesuk
Search find 4120  disqus socia  tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

NVIDIA анонсировала Rubin-CPX с 128 ГБ памяти GDDR7

NVIDIA представила Rubin-CPX — новый графический ускоритель на базе архитектуры Rubin, созданный специально для инференса в задачах с экстремально большими контекстными окнами. Он обеспечивает до 30 PetaFLOPS вычислительной мощности в формате NVFP4 и оснащён 128 ГБ памяти GDDR7. Согласно оценкам, при предполагаемой 512-битной шине пропускная способность памяти может достигать 1,8 ТБ/с. Ускоритель также получил поддержку четырёх NVENC и NVDEC, что делает его особенно интересным для задач видеогенерации и редактирования.

Rubin CPX

Rubin-CPX позволяет эффективно разделять обработку: этап Context/Prefill выполняется на одной GPU, а Generation/Decode — на другой, с передачей KV-кэша между ускорителями. Такая архитектура нацелена на высокопроизводительную генерацию при использовании миллионных токенов в задачах наподобие кодогенерации или LLM-инференса.

Параллельно NVIDIA представила серверные стойки Vera Rubin NVL144, которые сочетают Rubin-GPU с новыми CPU Vera. Такая стойка будет включать 144 GPU, обеспечивать 3,5 ExaFLOPS производительности и 1,4 PB/s HBM4-пропускной способности. Версия Vera Rubin NVL144-CPX объединяет 4 Rubin-CPX и 2 Vera Rubin ускорителя на один Compute Tray и заявлена как решение для задач с большими контекстами. Конфигурация обеспечивает до 8 ExaFLOPS, 1,7 PB/s и 100 ТБ быстрого объединённого хранилища (HBM4 + LPDDR).

Всё это станет доступно с конца 2026 года, а NVIDIA уже интегрировала эти продукты в свою трёхлетнюю roadmap, добавив Rubin Ultra и анонсировав переход на NVLink 6, HBM4E и Spectrum-6. В 2027 ожидается Rubin Ultra NVL576 с до 4 GPU в одном пакете и увеличенной памятью, а в 2028 — архитектура Feynman.

Топ материалов GameGPU