enfrdepluk
Position: toolbar-r [ Style: none outline]
Search find 4120  disqus socia  tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

NVIDIA улучшила производительность ИИ на GeForce RTX с новым драйвером R555

NVIDIA представила очередное обновление драйверов для своих графических процессоров GeForce RTX и платформ RTX AI PC, которое значительно увеличивает производительность искусственного интеллекта (ИИ). В рамках мероприятия Microsoft Build компания анонсировала новые оптимизации, доступные на платформе RTX, включающей графические процессоры GeForce RTX, рабочие станции и ПК.

R555 Drivers

Новые драйверы R555 предлагают трёхкратное увеличение производительности ИИ благодаря оптимизациям для ONNX Runtime (ORT) и DirectML. Эти инструменты используются для локального запуска моделей ИИ на ПК с Windows. Помимо этого, WebNN также ускорен с помощью DirectML на базе RTX, что позволяет веб-разработчикам внедрять новые модели ИИ.

Список возможностей, которые новые драйверы R555 предлагают для графических процессоров GeForce RTX и ПК на базе RTX:

  • Поддержка метакоманды DQ-GEMM для обработки квантования весов INT4 для больших языковых моделей (LLM)
  • Новые методы нормализации RMSNorm для моделей Llama 2, Llama 3, Mistral и Phi-3
  • Механизмы группового и многофункционального внимания, а также скользящее оконное внимание для поддержки Mistral
  • Обновления KV на месте для улучшения производительности внимания
  • Поддержка GEMM тензоров, не кратных 8, для улучшения производительности контекстной фазы

По результатам тестов производительности ORT, выпущенных Microsoft, NVIDIA демонстрирует значительные улучшения в работе как с данными INT4, так и FP16. Оптимизации в драйверах позволяют добиться до трехкратного увеличения производительности для таких моделей LLM, как Phi-3, Llama 3, Gemma и Mistral.

NVIDIA продолжает лидировать в области потребительских ИИ ПК благодаря мощному набору решений, таких как TensorRT и TensorRT-LLM, которые встроены в их графические процессоры. Эти решения включают революционную технологию DLSS Super Resolution, NVIDIA ACE, RTX Remix, Omniverse, Broadcast, RTX Video и другие технологии. Графические процессоры NVIDIA предлагают до 1300 TOPS вычислительной мощности ИИ, что значительно превосходит самые быстрые чипы, выходящие в этом году, которые ожидается достичь только 100 TOPS.

Топ материалов GameGPU

Position: bottom-d [ Style: none outline]

Топ новостей GameGPU