Radeon X800 XT особенности архитектуры

Автор myxxx323, . Опубликовано в Radeon Xxxx series

logo_b

Новая серия графических процессоров от ATI, имевшая внутреннее наименование «R420». С выходом RADEON X800 ATI решила разделить линейку графических карт по производительности и, в конечном итоге, по стоимости, несколько иным способом, нежели раньше.

Если видеокарты, основанные на RADEON 9800, отличались от плат на базе RADEON 9800 PRO и RADEON 9800 XT главным образом тактовыми частотами графического процессора и видеопамяти, то теперь различные модели RADEON X800 стали отличаться также количеством пиксельных конвейеров и разрядностью шины памяти. Определить, к чему это привело можно по этой небольшой таблице:

 

 

Модель RADEON X800 XT Platinum Edition RADEON X800 PRO RADEON X800 SE
Частота GPU 520 МГц 475 МГц 425
Число конвейеров 16 12 8
Тип памяти GDDR3 GDDR3 DDR
Объем памяти 256 МБ 256 МБ 128 МБ
Частота памяти 1120 МГц 900 МГц 700
Ширина шины 256 бит 256 бит 128 бит
Рекомендованная цена 9 9 $ 299

Как видно из таблицы, R420 был способен работать на значительно более высоких частотах, нежели его предшественники или даже NVIDIA NV40 (GeForce 6800/6800 Ultra)
Среди множества прочих причин, способствовавших достижению таких высоких тактовых частот, не последнее место занимает тот факт, что RADEON X800 производились по нормам 0.13-мкм техпроцесса с применением low-k диэлектриков и медных соединений.

Cуть технологии low-k заключается в применении специального изолирующего материала с низкой диэлектрической проницаемостью - «Black Diamond» - это позволяет значительно снизить паразитные емкости, возникающие между проводниками, соединяющими функциональные блоки графического процессора, расположенные на кристалле и добиться устойчивой работы на более высоких тактовых частотах. Уменьшение диэлектрической проницаемости, помимо всего прочего, позволяет добиться снижения энергопотребления и тепловыделения кристалла. Этой же цели способствует применение медных соединений - медь обладает меньшим электрическим сопротивлением, нежели алюминий, использовавшийся в старом, 0.15-мкм техпроцессе.

Энергопотребление

Именно из-за применения столь совершенного техпроцесса уровень энергопотребления и тепловыделения новых графических процессоров от ATI, не только не повысился, а даже понизился по сравнению с уровнем потребления и тепловыделения чипов предыдущего поколения, R360.
RADEON X800 PRO потреблял при загрузке порядка 50-60 ватт, тогда как аналогичный показатель RADEON 9800 XT составлял 65-75 ватт.
Таким образом, энергопотребление новой линейки RADEON оказалось значительно меньше, нежели у GeForce 6800 Ultra, что не может не радовать: необходимость в использовании сверхмощного (и сверхдорогого) БП отпадает - как минимально допустимый уровень ATI рекомендовала использовать 300-ваттные блоки питания, что, согласитесь, более демократично, чем 480 ватт по требованиям NVIDIA.

ATI R420: 8, 12 или 16 конвейеров?

Любопытно, что первоначально, ATI планировала ответить на новую архитектуру от NVIDIA восьмиконвейерным решением: полагалось, что этого будет достаточно. Однако, впоследствии речь зашла уже о 12 пиксельных конвейерах, а еще позже компания решила пустить в ход тяжелую 16-конвейерную артиллерию - видимо, опасаясь, что ответный удар может оказаться недостаточно сильным. Что ж NVIDIA GeForce 6800 Ultra – действительно, очень производительный графический чип, по всем основным параметрам значительно превосходящий бывшего лидера, ATI RADEON 9800 XT, и восьми или даже двенадцати пиксельных конвейеров для нового графического процессора от ATI могло оказаться недостаточно, чтобы победить NV40 в честном поединке.

High Definition Gaming

С объявлением новой архитектуры X800 (R420) и новой серии графических процессоров, RADEON X800 XT и RADEON X800 PRO, компания ATI ввела в обиход новую концепцию: High Definition Gaming.

Своим появлением концепция HD Gaming обязана рапространению HDTV - телевидения высокой четкости - и устройств отображения, поддерживающих стандарт HDTV.
Качество изображения в стандарте HDTV трудно сравнивать с обычным изображением: это не просто более высокое разрешение или большее количество деталей - это другой порядок качества. Появление HDTV компания ATI сравнивала с переходом от черно-белых изображений к цветным: большинству людей, видевших HDTV “вживую”, будет трудно вернуться к обычному качеству.
Впечатления от HD Gaming на персональных компьютерах ATI оценивала так же, как ощущения при переходе от обычного качества видео к HDTV: это стабильно высокая частота смены кадров в самых высоких разрешениях, включая 1600х1200 и 1920х1080, невероятная детализация, новый уровень качества картинки, реалистичные эффекты и по-настоящему живые миры.

Архитектура X800, способная воплотить HD Gaming, включала в себя ряд как совершенно новых, так и унаследованных от предыдущей архитектуры, но усовершенствованных технологий. Маркетинговые названия технологий сохранились, но теперь вместо цифровых индексов ATI добавляет к ним суффикс “HD”:
SMARTSHADER HD – вершинные и пиксельные процессоры X800
SMOOTHVISION HD – алгоритмы анизотропной фильтрации и полноэкранного сглаживания
HYPER Z HD – технологии, повышающие эффективность использования доступной пропускной способности шины памяти
3Dc – новый метод компрессии, обеспечивающий сжатие карт нормалей

Пиксельные конвейеры, пиксельные шейдеры

Первое, что бросается в глаза при рассмотрении особенностей RADEON X800 – повышенные тактовые частоты и увеличенное количество пиксельных конвейеров в новых графических процессорах от ATI: 16 у RADEON X800 XT Platinum Edition и 12 у RADEON 9800 PRO.
Впрочем, говорить о том, что RADEON X800 XT и X800 PRO имели, соответственно, 16 и 12 пиксельных конвейеров – не совсем корректно, несмотря на то, что, например, на упрощенной блок-схеме RADEON X800 можно увидеть те самые 16 конвейеров:

43110

16 пиксельных конвейеров RADEON X800 были объединены в 4 группы по 4 конвейера. Иными словами, RADEON X800, по сути, имел не 16 пиксельных конвейеров, а всего 4, но каждый из таких «широких» пиксельных конвейеров работал не с единичными пикселами, а с группами, состоящими из четырех пикселов.

43104

Соответственно, XT-версия RADEON X800 имел четыре таких конвейера, что соответствует 16 «обычным» пиксельным конвейерам, а PRO – всего три: RADEON X800 PRO был способен выводить 12 пикселов за такт.
Что примечательно, физически все версии графических процессоров RADEON X800 идентичны, все имеют полное число «широких» пиксельных конвейеров, но лишь RADEON X800 XT использовал все четыре конвейера. У RADEON X800 PRO один из конвейеров был отключен, а на RADEON X800 SE отключены уже два конвейера. Такая практика очень была удобна для ATI: когда кристаллы для всех версий графических процессоров изначально одинаковы, отключив те конвейеры, в которых при тестировании были найдены неисправности, можно использовать дефектные чипы для менее производительных решений и тем самым снизить число кристаллов, отправляющихся в брак.

Итак, каждый из четырех «широких» конвейеров RADEON X800 обрабатывал по четыре пиксела – они расположены блоком 2х2 (Quad). Одновременно в обработке - в очереди - мог находиться несколько (десятки или сотни) блоков 2х2: такая организация работы позволяла замаскировать латентность выборки и фильтрации текстур, которая могла измеряться десятками и сотнями тактов.

43106

Количество доступных временных регистров, доступных для использования в ходе исполнения шейдера, в R420 было увеличено по сравнению с R3x0, с 12 до 32. Таким образом, R420 оказался еще более нечувствительным к сложности шейдера – пиксельные процессоры архитектуры NV3x от NVIDIA резко теряли эффективность при исполнении сложных шейдеров, требующих задействования большого числа временных регистров.

Внутренняя точность вычислений с плавающей точкой в пиксельных процессорах при переходе к новой архитектуре не изменилась: RADEON X800 поддерживал представление данных в 16-битном и 32-битном формате с плавающей точкой, но все вычисления производит с 24-битной точностью.

43105

Вычислительная мощность пиксельных процессоров RADEON X800 по сравнению с предыдущей архитектурой серьезно увеличена: число скалярных и векторных арифметико-логических устройств (ALU) теперь увеличено вдвое. Если раньше пиксельные процессоры от ATI, имея одно векторное ALU, одно скалярное ALU и один блок адресации текстур, могли в сумме за один такт исполнить до трех инструкций над каждым пикселом, то в RADEON X800 число скалярных и векторных ALU было удвоено, и в результате пиксельные процессоры могли исполнить до пяти инструкций над каждым пикселом за один такт.

Помимо всех прочих усовершенствований, пиксельные процессоры RADEON X800 получили возможность исполнять более длинные шейдеры: по сравнению с предыдущим поколением максимальное число скалярных и векторных математических инструкций было увеличено с 64 до 512, а число текстурных инструкций – с 32 до 512. В сумме максимальное число текстурных инструкций, а также скалярных и векторных математических инструкций увеличилось со 160 до 1536.

Имея расширенную функциональность по сравнению с предыдущей архитектурой, ATI RADEON X800, тем не менее, не поддерживал динамические переходы и циклы в пиксельных шейдерах. Поэтому ATI не могла заявить о поддержке пиксельных шейдеров модели 3.0 - в отличие от 2.х, для шейдеров 3.0 поддержка динамических переходов и циклов являлась обязательным условием.

Вершинные конвейеры, вершинные шейдеры.

В первую очередь стоит сказать о том, что количество вершинных процессоров в RADEON X800 увеличено было увеличено до шести - предыдущие графические чипы высшего класса от ATI имели всего 4 вершинных процессора. Добавив к этому значительный рост тактовых частот новых графических процессоров, можно сразу представить минимальный прирост геометрической производительности при переходе на RADEON X800.

43109

Вершинные процессоры RADEON X800 так же, как и пиксельные процессоры, не поддерживали динамические переходы в вершинных шейдерах, что вкупе с отсутствием в вершинных процессорах блоков выборки текстур перечеркивали надежды увидеть в RADEON X800 аппаратную поддержку вершинных шейдеров модели 3.0.

HyperZ HD

HyperZ HD- дальнейшее развитие идей иерархического тайлового Z-буфера, реализованных во всех графических процессорах от ATI начиная с RADEON 256.
Основная цель HyperZ HD - было с максимальной эффективностью исключить из обработки те пикселы обрабатываемого в данный момент полигона, которые в пространстве сцены находятся позади уже отрисованных ранее и поэтому не войдут в финальное изображение.

Для эффективного исключения из обработки целых блоков пикселов технология HyperZ HD, помимо "обычного" Z-буфера использовал Z-буферы пониженного разрешения, или тайловые Z-буферы. Каждое значение из этих Z-буферов хранит самое большое значение Z, выбранное среди целого блока - тайла - пикселов.

VIDEOSHADER: видео и HDTV

В отличие от разработчиков NVIDIA, снабдивших свое детище, графический процессор NV40, специальными возможностями по обработке видеопотоков, инженеры ATI Technologies при переходе к новой архитектуре справедливо решили, что от добра добра не ищут, и оставили все как есть. Иными словами, механизм работы с видео в R420 остался тем же, что и в линейке R3x0/RV3x0. Впрочем, это не значит, что возможности R420 по обработке видео слабы. Уже со времен RADEON 9700 PRO, видеоадаптеры ATI умели использовать для этой цели вычислительные ресурсы пиксельных процессоров - технология VIDEOSHADER - так что с обработкой видео у RADEON X800 все в порядке. С помощью VIDEOSHADER графический процессор выполняет деинтерлейсинг, шумоподавление, конверсию цветовых пространств, а также своего рода сглаживание изображения, позволяющее убирать блочные артефакты, свойственные методам сжатия MPEG-4/DivX.

Стаистика загрузки процессора при использовании разных ускорителей

42940

3Dc: новый алгоритм компрессии карт нормалей

С появлением RADEON X800 компания ATI представила новый алгоритм компрессии, специально предназначенный для сжатия карт нормалей - 3Dc.
Карты нормалей являются дальнейшим развитием технологий имитации рельефности, и в настроящее время получают всё большее распространение. Суть карт нормалей состоит в сохранении информации о неровностях объекта в виде текстур, где каждый элемент текстуры хранит три компоненты вектора, перпендикулярного поверхности объекта в данной точке, то есть, вектора нормали.
Применение карт нормалей позволяет получить граздо более детальное и реалистичное изображение объекта, не увеличивая при этом число полигонов, описывающих этот объект. Соответственно, для создания карт нормалей для объекта достаточно создать высокополигональную модель и упрощенную модель объекта и на основании разницы между этими моделями создать карту нормалей. В дальнейшем можно использовать лишь упрощенную модель, но при применении ранее созданной карты нормалей внешний вид объекта даже при применении более простой модели будет близок к исходному виду:

43101

Использование нового метода компрессии карт нормалей позволяло снизить нагрузку на шину памяти при использовании высокодетализированных карт или, наоборот, сохранив объемы данных на том же уровне, увеличить детализацию карт нормалей.

Анизотропная фильтрация

Обновленные алгоритмы полноэкранного сглаживания и анизотропной фильтрации, реализованные в RADEON X800, ATI объединяло под названием SMOOTHVISION HD.
RADEON X800 получил обновленную версию алгоритма анизотропной фильтрации, позволяющую уменьшить падение производительности без снижения качества изображения.

 

Характеристики ATI Radeon X800 XT

 

Наименование Radeon X800 XT
Ядро R423/R420
Техпроцесс (мкм) 0.13 (low-k)
Транзисторов (млн) 160
Частота работы ядра 500
Частота работы памяти (DDR) 500 (1000)
Шина и тип памяти GDDR3 256 Bit
ПСП (Гб/с) 32
Пиксельных конвейеров 16
TMU на конвейер 1
Текстур за такт 16
Текстур за проход 16
Вершинных конвейеров 6
Pixel Shaders 2.0b
Vertex Shaders 2.0b
Fill Rate (Mpix/s) 8000
Fill Rate (Mtex/s) 8000
DirectX 9.0b
Anti-Aliasing (Max) MS-6x
Анизотропная фильтрация (Max) 16x
Объем памяти 256
Интерфейс PCI-E/AGP
RAMDAC 2x400

 

Итак, графические процессоры нового поколения от ATI в показали себя достойными конкурентами новой архитектуре от NVIDIA.

Старшая модель, RADEON X800 XT, превзошла GeForce 6800 Ultra там, где этого и следовало ожидать, то есть, в большинстве современных игр как с высокой геометрической сложностью, так и широко использующих сложные пиксельные шейдеры. При включении полноэкранного сглаживания и анизотропной фильтрации соотношение результатов игровых тестов изменяются в пользу новых графических процессоров от ATI – они используют эффективную технологию HyperZ HD, снижающую нагрузку на шину памяти, и высокопроизводительный метод анизотропной фильтрации.Но явным мисуом новых карт являлась отсутствие поддержки шейдеров версии 3.0 что некоторым образом делало их менее передовым решением в сравнении с конкурентом

Far Cry

6373

Печать