arzh-CNenfrdejakoplptesuk
Search find 4120  disqus socia  tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

Nvidia GB300 NVL72 показала рекордный прирост производительности — +45% к DeepSeek R1 против GB200

Nvidia официально представила результаты бенчмарков MLPerf для своей новой rack-scale-системы Blackwell Ultra GB300 NVL72, заявив о 45% приросте производительности при инференсе DeepSeek R1 по сравнению с прошлым поколением GB200. Система объединяет обновлённую архитектуру, ускоренные тензорные блоки и целый ряд оптимизаций на программном уровне, что позволило Nvidia занять первое место во всех ключевых тестах, включая Llama 3.1 405B, Llama 3.1 8B и Whisper.

Blackwell Ultra GB300

На фоне развёртывания GB200 в глобальных дата-центрах, новая версия GB300 с архитектурой Blackwell Ultra идёт дальше, предлагая значительно увеличенный пропускной канал между GPU — 130 ТБ/с через 1,8 ТБ/с NVLink между каждой из 72 графических систем в стойке. Это позволило эффективно масштабировать работу даже самых больших языковых моделей, сохранив стабильную задержку при высоком объёме обработки.

Ключевыми компонентами прироста стали обновлённые тензорные ядра, обеспечивающие в 2 раза более быстрые attention-операции и на 50% больше FLOPS при задачах ИИ, а также активное использование формата NVFP4 для квантования весов. Это дало возможность сократить объём модели без потери точности и ускорить вычисления, особенно в задачах инференса на DeepSeek R1.

По словам Nvidia, эти улучшения могут сделать Blackwell Ultra главным инструментом в строительстве так называемых «ИИ-фабрик», где оптимизация мощности напрямую влияет на прибыльность обработки. Согласно их заявлениям, GB300 способен работать в 5 раз быстрее, чем ускорители Hopper, что особенно актуально на фоне конкурентных решений AMD и Huawei, также демонстрирующих рост в сегменте ИИ-ускорителей.

С учётом того, что поставки GB300 стартуют уже в этом месяце, публикация рекордных результатов MLPerf выглядит как часть стратегической кампании Nvidia по укреплению своего лидерства в корпоративных AI-решениях.

Топ материалов GameGPU