Большие языковые модели (LLM) требуют значительного объема памяти – настолько, что энтузиасты искусственного интеллекта часто используют многопроцессорные конфигурации, чтобы увеличить доступную видеопамять для своих AI-приложений. Однако из-за чрезвычайно больших объемов LLM даже такой подход имеет свои пределы. В некоторых случаях графический процессор (GPU) передает вычисление центральному процессору (CPU), и тогда на первый план выходит производительность кэша ЦП и оперативной памяти (DRAM). Это означает, что для эффективности AI-приложений важна не только GPU, но и вся цепь соединения GPU с CPU и модулями DRAM. Соответственно появляются возможности для оптимизации этих компонентов с целью повышения производительности.
Именно это было продемонстрировано в ходе исследований в лабораториях R&D компании ASUS с использованием новейших процессоров AMD Ryzen. Недавно AMD представила два новых процессора Ryzen с технологией AMD 3D V-Cache – AMD Ryzen 9 9950X3D и AMD Ryzen 9 9900X3D, выводящих серию Ryzen на новый уровень. После масштабного тестирования различных оптимизации в широком спектре нагрузок был идентифицирован набор настроек, обеспечивающих ощутимые преимущества для AI-приложений. Результаты этих исследований были воплощены в новой функции BIOS – AI Cache Boost. В реальных сценариях работы с большими LLM AI Cache Boost обеспечивает прирост производительности до 12,75%.
Готовность к процессорам AMD Ryzen с технологией AMD 3D V-Cache
Для активации AI Cache Boost необходима материнская плата ASUS серии AMD 800 и процессор AMD Ryzen 9000 Granite Ridge. В UEFI BIOS необходимо перейти на вкладку Extreme Tweaker и включить соответствующую функцию — система будет готова к работе.
Функция AI Cache Boost активирует ряд оптимизации, включая разгон частоты Infinity Fabric clock (FCLK) до 2100 МГц. Повышение FCLK является ключевым фактором, ведь увеличивает пропускную способность между ядрами CPU, кэшем и модулями памяти – что особенно важно для работы с большими LLM.
Для пользователей, использующих одну систему и для AI-приложений, и для игр, следует знать: включение AI Cache Boost практически не влияет на игровую производительность. Функцию можно оставлять активной при переключении между разными типами нагрузок. По желанию, для повышения стабильности в играх, частоту FCLK можно вручную снизить до более консервативного значения после активации.
Производительность с AI Cache Boost
В тестовой конфигурации использовалась материнская плата ROG Crosshair X870E Hero, видеокарта NVIDIA GeForce RTX 5090 и 2x16 ГБ DDR5 RAM. Были протестированы несколько процессоров с AMD 3D V-Cache: Ryzen 9 9950X3D, 9900X3D и 9800X3D. Первым тестом стал Geekbench AI с фреймворком ONNX DirectML, измеряющим производительность GPU.
В зависимости от конфигурации прирост производительности составлял от 4% до 8%. Это существенно для пользователей, которые ежедневно работают с AI-нагрузками, особенно учитывая простоту активации функции.
Поскольку серия NVIDIA RTX 50 новая на рынке, было проведено дополнительное тестирование на предыдущем поколении видеокарт — в частности, с NVIDIA RTX 4090.
В тесте Geekbench AI с RTX 4090 активация AI Cache Boost позволила достичь прироста производительности до 7,57% с AMD Ryzen 7 9800X3D, показавшим самый высокий результат среди протестированных процессоров.
Аналогичную динамику показал тест UL Procyon AI Computer Vision Benchmark, где Ryzen 7 9800X3D достиг улучшения производительности на 12,75% с активированной функцией.
Добавление Turbo Game Mode
Высокие результаты Ryzen 7 9800X3D в тестах свидетельствуют, что AMD 3D V-Cache в некоторых AI-сценариях дает большее преимущество, чем большее количество ядер у Ryzen 9 9950X3D и 9900X3D. Для более подробного анализа были проведены дополнительные тесты с включением как AI Cache Boost, так и Turbo Game Mode.
Turbo Game Mode, доступный на материнских платах ASUS AM5, оптимизирует систему двумя способами:
- Выключает второй CCD (Core Complex Die) – актуально для процессоров с двумя CCD. Это позволяет уменьшить задержки в приложениях, не использующих все ядра.
- Выключает SMT (Simultaneous Multithreading) – одновременное многопоточность. В некоторых сценариях отключение SMT позволяет повысить эффективность в нагрузках, не требующих большого количества потоков.
Из-за существенного влияния на многопоточную производительность Turbo Game Mode рекомендуется включать только при необходимости.
В конфигурации с активированными AI Cache Boost и Turbo Game Mode Ryzen 9 9950X3D демонстрирует самый высокий прирост производительности среди всех протестированных вариантов – на 19,85% по сравнению с базовыми настройками.
Эти результаты свидетельствуют, что для пользователей AI-приложений, не использующих все доступные потоки CPU, сочетание двух BIOS-функций может быть очень выгодным. Обе функции доступны на вкладке Extreme Tweaker BIOS, что делает их использование удобным даже для менее опытных пользователей.
AI-амбициозности на новом уровне с ASUS и AI Cache Boost
Процессоры AMD Ryzen 9 9950X3D и 9900X3D открывают новые возможности для энтузиастов ПК. Благодаря 32 и 24 потокам соответственно они обеспечивают мощную многопоточную производительность, а также пользуются преимуществами технологии AMD 3D V-Cache.
Материнские платы ASUS серии AMD 800 помогают максимально реализовать потенциал этих процессоров через BIOS-оптимизацию. В частности, AI Cache Boost является очень эффективным инструментом для повышения производительности в AI-рабочих процессах, использующих LLM.
Чтобы получить максимум новых процессоров AMD, стоит обратить внимание на полную линейку материнских плат ASUS AM5 — от флагманских X870E и X870 до более доступных B850 и B840.