Почему апскейлинг и генерация кадров работают не на всех видеокартах

Автор Maximum Games, 04 Май 2025. Опубликовано в Test Video Cards

Технологии апскейлинга и генерации кадров за последние пять лет стали неотъемлемой частью игрового графического рендеринга. Они позволяют достичь высокого качества изображения при меньших затратах производительности, а также повышают плавность геймплея даже на ультра-настройках. Однако большинство подобных решений — таких как DLSS от NVIDIA, FSR от AMD и XeSS от Intel — ограничены в совместимости: одни работают только на определённых поколениях GPU, другие вовсе эксклюзивны для одной архитектуры. Почему так происходит? В этой статье мы подробно разберёмся в происхождении, развитии и аппаратных ограничениях самых популярных апскейлеров, чтобы понять, почему они не поддерживаются на всех видеокартах.

Как появились апскейлы: на примере DLSS и генерации кадров DLSS

Современные апскейлы представляют собой результат долгой эволюции технологий рендеринга, начавшейся с простой фильтрации и сглаживания и приведшей к использованию нейросетей и машинного обучения. Переломный момент наступил в 2018 году, когда NVIDIA представила первую версию DLSS (Deep Learning Super Sampling). Хотя изначально технология планировалась как интеллектуальный алгоритм сглаживания, её создатели, во главе с Дженсеном Хуаном, быстро поняли, что потенциал DLSS выходит далеко за рамки простой борьбы с «лесенками» на краях объектов. Ставка была сделана на повышение производительности за счёт апскейлинга изображения с более низкого разрешения до высокого при сохранении визуального качества, сравнимого с нативным рендерингом.

DLSS 1.0 использовал обученные на конкретных играх модели нейросетей, что требовало значительных усилий от разработчиков: NVIDIA должна была предварительно анализировать каждую игру и обучать модель с учётом уникальных характеристик сцены и поведения камеры. Это ограничивало гибкость и вызывало нарекания в адрес качества: в некоторых тайтлах наблюдалась чрезмерная мыльность или артефакты.

DLSS 2.0

DLSS 2.0 полностью изменила подход: была создана универсальная архитектура, использующая временные буферы, данные движения, карты глубины и цвета, а также усовершенствованный алгоритм аппроксимации деталей. Это позволило существенно улучшить качество и упростить интеграцию в игры. DLSS 2.0 работал стабильно и качественно на множестве проектов без дополнительного обучения.

С DLSS 3 NVIDIA пошла дальше: была представлена генерация кадров (Frame Generation), в рамках которой система не просто улучшала разрешение, но и создавала новые кадры на основе анализа движения между предыдущими двумя. Это стало возможным благодаря Optical Flow Accelerator — блоку, способному интерпретировать векторы движения и особенности сцены на уровне пиксельных потоков. Однако полноценная генерация кадров требует не только хорошего потока данных, но и быстрого принятия решений в реальном времени. Поэтому DLSS 3 стал эксклюзивом RTX 40: архитектура Ada Lovelace позволила добиться нужной скорости обработки благодаря третьему поколению Tensor Core и Reflex-системе.

DLSS 4

Следующая ступень — DLSS 4 — появилась в 2025 году и была эксклюзивной для RTX 50. В этой версии NVIDIA внедрила Multi Frame Generation — метод, при котором между каждым реальным кадром вставляется сразу несколько «предсказанных» фреймов. Это стало возможным благодаря применению трансформерных моделей нейросетей — тех же, что используются в современном NLP и генеративных ИИ. Для работы таких моделей требуются гигантские вычислительные мощности и пропускная способность, а также специализированные аппаратные блоки для обучения и инференса. RTX 50 впервые предложила такие компоненты: Tensor Core пятого поколения, ускоренные RT-блоки и расширенные кэши. Таким образом, DLSS эволюционировал от сглаживания к полноценному видеогенератору, но каждый шаг вперёд сопровождался повышением требований к железу.

Как появился FSR и генерация кадров FSR

AMD пошла по совершенно иному пути. В 2021 году компания представила первую версию FidelityFX Super Resolution (FSR), начав с максимально универсального решения: FSR 1.0 был полностью пространственным алгоритмом апскейлинга. Он не опирался на временную информацию, не требовал машинного обучения и запускался на любом современном GPU, включая карты NVIDIA и даже интегрированную графику Intel. Такой подход обеспечил моментальное распространение технологии, но качество было ниже, чем у DLSS.

С появлением FSR 2.0 в 2022 году AMD добавила в алгоритм временные буферы и векторы движения. Это дало качественный скачок в апскейлинге, сделав изображение менее шумным и повысив стабильность в динамике. Однако FSR по-прежнему не использовал нейросети — его главной целью была доступность.

Это изменилось с выходом FSR 3 в 2023 году: AMD представила генерацию кадров, по аналогии с DLSS 3. И хотя технология оставалась «открытой», для корректной работы FSR 3 требовалась более высокая производительность, включая эффективную реализацию оптического потока и работу с временными буферами. По этой причине генерация кадров в FSR 3 работала далеко не на всех GPU.

FSR 4, вышедший в 2025 году, стал ещё более требовательным. В этой версии AMD впервые добавила элементы машинного обучения: применяются локальные нейросетевые фильтры, временные модели движения и предсказание поведения камеры. Для этого понадобились новые блоки внутри архитектуры RDNA 4, получившие неофициальное название AI-ускорителей. Эти компоненты присутствуют только в Radeon RX 9000 и новее. Таким образом, хотя основа FSR 4 остаётся открытой, её продвинутые функции FG (Frame Generation) работают исключительно на последних видеокартах AMD.

Как появился XeSS

XeSS (Xe Super Sampling) был представлен компанией Intel в 2022 году как ответ на существующие решения от AMD и NVIDIA. В отличие от конкурентов, Intel изначально поставила цель сделать свою технологию универсальной и кроссплатформенной. XeSS использует машинное обучение, но реализует его с учётом различий в аппаратном обеспечении. На видеокартах Intel Arc используется аппаратное ускорение через XMX-блоки (Xe Matrix Extensions) — специализированные модули, аналогичные Tensor Core у NVIDIA. Эти блоки предназначены для быстрого выполнения матричных операций, необходимых при инференсе нейросетей.

Для других видеокарт XeSS поддерживает fallback-режим, основанный на DP4a-инструкциях — это возможность ускоренного вычисления через SIMD, присутствующая в GPU начиная с NVIDIA GTX 10-й серии и AMD RDNA 1. При этом качество изображения и производительность уступают XMX-режиму. Такая гибкая архитектура позволила Intel обеспечить минимальную совместимость с широким набором оборудования.

Intel продвигает XeSS как технологию с открытой спецификацией. Однако последние обновления — версии 1.3 и выше — добавили поддержку экспериментальных функций временной генерации кадров. Пока они доступны только на графике Intel Battlemage, где реализована вторая версия XMX-ядер. Эти ядра получили улучшенную пропускную способность, поддержку работы с переменной точностью (FP8/INT4) и оптимизацию для real-time задач.

Таким образом, хотя XeSS начинался как максимально открытый и совместимый проект, его эволюция показывает, что продвинутые функции тоже начинают требовать аппаратной поддержки. И если базовое апскейление доступно практически на всех GPU, то функции, аналогичные DLSS 3 и 4, требуют последних графических процессоров Intel.

Почему DLSS 1 и 2 не поддерживались на видеокартах кроме RTX

Ограничение DLSS 1 и 2 только на видеокартах RTX объясняется технической архитектурой этих решений. Обе версии изначально разрабатывались с опорой на Tensor Core — специализированные модули для нейросетевых операций, впервые представленные в архитектуре Turing. Эти ядра обеспечивают высокую скорость выполнения матричных умножений, что необходимо для выполнения сверточных операций в глубоких нейросетях.

Tensor Core

GTX-серия (например, GTX 1080 Ti) и видеокарты AMD не обладают такими блоками. Даже если попытаться эмулировать DLSS с использованием обычных CUDA-ядер или шейдерных блоков, производительность падает в десятки раз, а результат становится бесполезным. Кроме того, DLSS использует NGX SDK (Neural Graphics Acceleration), который выполняет проверку наличия Tensor Core и архитектуры RTX на уровне драйвера.

Таким образом, даже при наличии мощного графического чипа (например, TITAN V) невозможно запустить DLSS: отсутствие NGX-интеграции и Tensor Core блокирует доступ к API. Сторонние попытки модифицировать SDK или запускать DLSS через внешние хакерские методы не дают результатов, поскольку сама логика работы DLSS базируется на тесной связке железа и программного кода.

Почему генерация кадров DLSS 3 поддерживается на видеокартах не ниже RTX 40

Генерация кадров в DLSS 3 опирается на технологию Optical Multi Frame Flow, которая реализована в архитектуре Ada Lovelace. Для анализа движения между кадрами используется Optical Flow Accelerator третьего поколения — специализированный аппаратный модуль, отсутствующий в RTX 30 и младших сериях.

Этот ускоритель рассчитывает векторы движения между пикселями в двух кадрах, используя карты глубины, буферы скорости и теневые маски. Без этого модуля невозможно точно сгенерировать промежуточный кадр — результатом станут визуальные артефакты и «двоение» изображения. Именно поэтому RTX 30, несмотря на наличие Tensor Core, не может поддерживать DLSS 3 Frame Generation.

Дополнительно DLSS 3 требует взаимодействия с системой NVIDIA Reflex. Она синхронизирует кадры между CPU и GPU, снижая input lag. Без Reflex внедрение дополнительных кадров сильно увеличивало бы задержку управления. Поддержка Reflex в DLSS 3 строго связана с архитектурой Ada Lovelace, что делает её невозможной на RTX 30.

Почему генерация кадров DLSS 4 поддерживается на видеокартах не ниже RTX 50

DLSS 4 требует архитектуры Blackwell и новых Tensor Core пятого поколения. Эта версия использует трансформерные модели — сложные нейросети, способные предсказывать динамику сцены на 3–4 кадра вперёд. Для этого необходимо буферизовать несколько временных слоёв: оптический поток, карты глубины, маски движения, состояния частиц и поведение камеры.

Подобная многоуровневая обработка требует высокоскоростного доступа к видеопамяти, дополнительной линии кеширования и переработанной иерархии ALU-блоков. Все эти компоненты впервые реализованы только в RTX 50. Даже RTX 40 с её мощной архитектурой не может обеспечить одновременную обработку 4–6 временных буферов в реальном времени.

К тому же DLSS 4 требует удвоенного пропускного канала для операций смешанного типа (FP16/INT8) и наличие преобразующих модулей для адаптивной масштабируемости — эти функции встроены в Tensor Core 5.0. Таким образом, сдвиг в сторону Multi Frame Generation потребовал радикального обновления архитектуры, что и делает DLSS 4 невозможным на более старых картах.

Почему генерация кадров FSR поддерживается на видеокартах не ниже RX 9000

FSR 4 от AMD стал первым, кто внедрил адаптивную генерацию кадров на базе ML. В отличие от FSR 3, где кадры генерировались по жёстко заданному алгоритму с опорой на оптический поток, в FSR 4 применяется обучаемая система предсказания, основанная на временных паттернах и анализе предыдущих состояний сцены. Для выполнения этих задач необходимы аппаратные ускорители ИИ — блоки AI Compute Units, появившиеся только в архитектуре RDNA 4.

FSR 4 AI Compute Units

Видеокарты серий RX 6000 и 7000 (RDNA 2 и 3) не содержат этих блоков. Кроме того, им не хватает ширины шин памяти, необходимой для параллельной обработки буферов движения и предсказательных моделей. Также FSR 4 использует обновлённый FidelityFX SDK версии 5.0, который несовместим с устаревшей микрокодовой базой драйверов GCN и RDNA 2.

FSR 4 требует как минимум 64 AI-ядра, поддержку BFLOAT16, переменную длину инструкций и обработку в режиме INT4 — всё это появилось в RX 9000. Поэтому, несмотря на формальную открытость FSR, новая генерация кадров работает исключительно на последних видеокартах AMD.

Заключение

Современные апскейлы перестали быть простыми алгоритмами растягивания картинки. Это сложные системы, включающие элементы компьютерного зрения, анализа движения, работы с временными буферами и даже трансформерные нейросети. Поэтому неудивительно, что для их полноценной работы требуется специализированное аппаратное обеспечение: тензорные ядра, ускорители оптического потока, AI-блоки и усовершенствованные кеши. Каждая новая итерация DLSS, FSR или XeSS поднимает планку, но и жёстче привязывает технологии к конкретным поколениям видеокарт. Таким образом, отсутствие поддержки на старых GPU объясняется не жадностью производителей, а объективными техническими рамками. Прогресс требует новых решений — и новых чипов, способных справляться с возросшей сложностью графики в реальном времени.