NVIDIA ускоряет вывод результатов на Llama 3.1 до 1.9x благодаря новому алгоритму Medusa для HGX H200

Автор svl, 08 Сентябрь 2024. Опубликовано в Железо

NVIDIA продолжает улучшать свою программную экосистему, представив новый алгоритм Medusa для ускорения работы ИИ-моделей Llama 3.1 на своих ускорителях HGX H200. Этот инновационный алгоритм, использующий технику "спекулятивного декодирования", помогает увеличить скорость генерации токенов до 1.9x, что обеспечивает высокую производительность при работе с большими языковыми моделями.

NVIDIA HGX H200

С помощью Medusa, сервера NVIDIA HGX H200 с восемью GPU H200 Tensor Core могут достигать скорости генерации 268 токенов в секунду на Llama 3.1 70B и 108 токенов на Llama 3.1 405B. Это значительно ускоряет взаимодействие с моделями, где каждая GPU обменивается данными через NVLink Switch на скорости 900 ГБ/с. Такая архитектура позволяет избежать узких мест в коммуникации между GPU и обеспечивает высокую производительность.

Технология TensorRT-LLM, интегрированная с Medusa, оптимизирует использование параллельных вычислительных ресурсов GPU, что делает возможной более эффективную генерацию токенов. NVIDIA продолжает инновации во всех аспектах своей технологии, что обеспечивает лидирующие позиции компании на рынке решений для ИИ.

В начало страницы

NVIDIA ускоряет вывод результатов на Llama 3.1 до 1.9x благодаря новому алгоритму Medusa для HGX H200

HARDWARE НОВОСТИ

ROG Matrix Platinum RTX 5090 выйдет 27 ноября по цене €4099 — всего 1000 экземпляров

ASUS ROG Matrix RTX 5090 выйдет по ошеломляющей цене €4099

Пользователь Radeon RX 9070 XT Nitro+ опроверг массовость проблемы с выгоранием 12-pin разъема

Microsoft предупреждает: октябрьское обновление может вызвать сбой BitLocker

ASUS представила блоки питания Pro WS Platinum мощностью до 3000 Вт

Google представила чипы Ironwood TPU и Axion CPU, бросая вызов Nvidia

Пресборки Corsair «жарят» процессоры i9-14900K из-за устаревшего BIOS

DGX Spark запускает Cyberpunk 2077 через эмуляцию: первые тесты показали до 50 FPS

Старый процессор AMD FX-9590 запускает Battlefield 6 с играбельным FPS

Intel готовит Core i9-15900K: 12 P-ядер, 24 потока и 6.0 ГГц для "старого" сокета LGA 1700

SOFTWARE НОВОСТИ

ROG Matrix Platinum RTX 5090 выйдет 27 ноября по цене €4099 — всего 1000 экземпляров

Marvel 1943: Rise of Hydra отложена — новая дата выхода намечена на середину–конец 2026 года

Rockstar Games отложила релиз GTA VI с мая на ноябрь 2026 года

ASUS ROG Matrix RTX 5090 выйдет по ошеломляющей цене €4099

Пользователь Radeon RX 9070 XT Nitro+ опроверг массовость проблемы с выгоранием 12-pin разъема

Microsoft предупреждает: октябрьское обновление может вызвать сбой BitLocker

Intel Arc Pro B60 выходит на рынок DIY в Европе: старт в ноябре, цена от €769

ASUS представила блоки питания Pro WS Platinum мощностью до 3000 Вт

Google представила чипы Ironwood TPU и Axion CPU, бросая вызов Nvidia

Итоги 2025 игрового года: Hades II лидирует, Silksong наконец вышел