NVIDIA улучшила производительность ИИ на GeForce RTX с новым драйвером R555

Автор svl, 22 Май 2024. Опубликовано в Железо

NVIDIA представила очередное обновление драйверов для своих графических процессоров GeForce RTX и платформ RTX AI PC, которое значительно увеличивает производительность искусственного интеллекта (ИИ). В рамках мероприятия Microsoft Build компания анонсировала новые оптимизации, доступные на платформе RTX, включающей графические процессоры GeForce RTX, рабочие станции и ПК.

Новые драйверы R555 предлагают трёхкратное увеличение производительности ИИ благодаря оптимизациям для ONNX Runtime (ORT) и DirectML. Эти инструменты используются для локального запуска моделей ИИ на ПК с Windows. Помимо этого, WebNN также ускорен с помощью DirectML на базе RTX, что позволяет веб-разработчикам внедрять новые модели ИИ.

Список возможностей, которые новые драйверы R555 предлагают для графических процессоров GeForce RTX и ПК на базе RTX:

Поддержка метакоманды DQ-GEMM для обработки квантования весов INT4 для больших языковых моделей (LLM)
Новые методы нормализации RMSNorm для моделей Llama 2, Llama 3, Mistral и Phi-3
Механизмы группового и многофункционального внимания, а также скользящее оконное внимание для поддержки Mistral
Обновления KV на месте для улучшения производительности внимания
Поддержка GEMM тензоров, не кратных 8, для улучшения производительности контекстной фазы

По результатам тестов производительности ORT, выпущенных Microsoft, NVIDIA демонстрирует значительные улучшения в работе как с данными INT4, так и FP16. Оптимизации в драйверах позволяют добиться до трехкратного увеличения производительности для таких моделей LLM, как Phi-3, Llama 3, Gemma и Mistral.

NVIDIA продолжает лидировать в области потребительских ИИ ПК благодаря мощному набору решений, таких как TensorRT и TensorRT-LLM, которые встроены в их графические процессоры. Эти решения включают революционную технологию DLSS Super Resolution, NVIDIA ACE, RTX Remix, Omniverse, Broadcast, RTX Video и другие технологии. Графические процессоры NVIDIA предлагают до 1300 TOPS вычислительной мощности ИИ, что значительно превосходит самые быстрые чипы, выходящие в этом году, которые ожидается достичь только 100 TOPS.

В начало страницы

NVIDIA улучшила производительность ИИ на GeForce RTX с новым драйвером R555

HARDWARE НОВОСТИ

Silicon Motion представила первый контроллер SSD с интерфейсом PCIe 6.0 для клиентских ПК

Поддержка 16x MSAA отключена для графических процессоров Intel Xe3 в Mesa 3D

AMD разрабатывает новые чипы для Microsoft

SanDisk и SK hynix создают новый стандарт High Bandwidth Flash — гибрид NAND и HBM

AMD официально представила Radeon PRO W7400 — компактную профессиональную видеокарту на RDNA 3 с 8 ГБ GDDR6 и TDP 55 Вт

AVX 10.2 с 512-битными инструкциями возвращается в будущие процессоры Intel Core

Dell Pro Max 18 Plus: первый ноутбук с RTX Pro 5000 Blackwell показал 207K баллов в OpenCL

DDR4 всё ещё жив: память останется на рынке до 2026 года

Radeon RX 7400 дебютировала в составе ПК Dell — возможный OEM-эксклюзив на базе RDNA 3

ASUS выпустила самую тихую RTX 5080 — модель Noctua OC с тройным охлаждением и 4-слотовым дизайном

SOFTWARE НОВОСТИ

Silicon Motion представила первый контроллер SSD с интерфейсом PCIe 6.0 для клиентских ПК

Поддержка 16x MSAA отключена для графических процессоров Intel Xe3 в Mesa 3D

AMD разрабатывает новые чипы для Microsoft

SanDisk и SK hynix создают новый стандарт High Bandwidth Flash — гибрид NAND и HBM

AMD официально представила Radeon PRO W7400 — компактную профессиональную видеокарту на RDNA 3 с 8 ГБ GDDR6 и TDP 55 Вт

Call of Duty: Black Ops 7 потребует Secure Boot и TPM 2.0

AVX 10.2 с 512-битными инструкциями возвращается в будущие процессоры Intel Core

Battlefield 6: перед стартом открытой беты сервера уже перегружены — десятки тысяч игроков в ожидании

Dell Pro Max 18 Plus: первый ноутбук с RTX Pro 5000 Blackwell показал 207K баллов в OpenCL

DDR4 всё ещё жив: память останется на рынке до 2026 года

Топ материалов GameGPU

The Elder Scrolls IV: Oblivion Remastered тест GPU/CPU...

The Last of Us Part II Remastered тест GPU/CPU...

Assassin’s Creed Shadows тест GPU/CPU...

DOOM: The Dark Ages тест GPU/CPU...

Clair Obscur: Expedition 33 тест GPU/CPU...

Grand Theft Auto V Enhanced Edition тест GPU/CPU...

Топ новостей GameGPU

NVIDIA GeForce 590.26: драйвер с поддержкой GSP, Smooth Motion и...

NVIDIA Smooth Motion теперь доступна на RTX 40 через драйвер...

Battlefield 6: системные требования...

GPD Win 5 замечен в Geekbench с мощным AMD Ryzen...

GeForce 60-й серии от NVIDIA обещает беспрецедентный скачок в производительности...

Huawei показала суперкластер CloudMatrix 384 с производительностью выше NVIDIA GB200...