NVIDIA демонстрирует 2,2-кратный прирост производительности Blackwell по сравнению с Hopper в тестах AI
NVIDIA представила первые результаты тестов своей новой архитектуры Blackwell в AI-тренировках на MLPerf v4.1, продемонстрировав впечатляющий 2,2-кратный прирост производительности по сравнению с чипами предыдущего поколения Hopper. Эти данные свидетельствуют о том, что Blackwell задает новый стандарт для AI-технологий и становится сердцем будущих дата-центров.
MLPerf v4.1 охватывает широкий спектр AI-задач, включая Llama 2 70B (точная настройка), Stable Diffusion (преобразование текста в изображение), BERT (обработка естественного языка) и GPT-3 175B (предобучение). NVIDIA заявляет, что Blackwell, будучи частью суперкомпьютера Nyx AI, показывает двукратное ускорение в тренинге GPT-3 и 2,2-кратный прирост в Llama 2 70B по сравнению с Hopper H100.
Основные достижения Blackwell:
- Новый рекорд производительности в AI-обучении на одном ускорителе.
- Превосходное использование Tensor Cores и новая высокоскоростная память HBM3e для увеличения производительности.
- Blackwell позволяет выполнять тест GPT-3 на 175B с использованием всего 64 GPU против 256 GPU, необходимых для Hopper.
NVIDIA также анонсировала свою дальнейшую дорожную карту, где ожидается выход Blackwell Ultra с увеличенным объемом памяти (288 ГБ HBM3e) и ещё большей вычислительной мощностью в 2025 году, за которым последует архитектура Rubin в 2026–2027 годах.
Blackwell уже находится в состоянии массового производства, и NVIDIA ожидает, что новые показатели помогут компании достичь рекордных финансовых и производственных результатов в ближайшие кварталы.