gamegpu     Search find 4120

 tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

Radeon 9700 Pro особенности архитектуры

_radeon9700pro_banner

7-го августа 2002 года компания ATI объявила новый чип - ATI RADEON 9700 PRO. Главное качество нового чипа - полная аппаратная поддержка требований, диктуемых спецификациями DirectX9 от Microsoft.
Что характерно, чип был объявлен задолго до появления финальной версии DirectX9. Новый чип от ATI значительно превосходил остальные существующие на тот момент игровые 3D-чипы, как по сложности, так и по техническим характеристикам, и, пока NVIDIA разбираелась с новым технологическим процессом и подготавливала выход NV30, имел все шансы стать единоличным лидером в мире игровой графики.

Перечислим ключевые характеристики чипа от ATI:
Общие сведения:
Технология изготовления - 0.15 мкм;
Число транзисторов - ~110 млн.;
Тип корпуса - FCPGA;
Тактовая частота - 325 МГц в варианте ATI RADEON 9700 PRO;
Шина памяти - 256 бит DDR SDRAM;
Максимальный объем видеопамяти - 256 МБ;
Тактовая частота видеопамяти - 620(310 DDR) МГц в варианте ATI RADEON 9700 PRO;
Поддержка AGP 2X (3.3v), 4X (1.5V), 8X (0.8v) и Universal AGP 3.0 (2X/4X/8X);
Поддержка спецификаций PC2002.
3D-часть:
Восемь пиксельных конвейеров, удовлетворяющих требованиям спецификации пиксельных шейдеров DirectX 9 версии 2.0 (технология SMARTSHADER 2.0 от ATI);
По одному блоку выборки текстур в каждом пиксельном процессоре;
Поддержка билинейной, трилинейной, анизотропной и сочетания трилинейной и анизотропной фильтрации текстур;
Четыре вершинных конвейера, удовлетворяющих требованиям спецификации вершинных шейдеров DirectX 9 версии 2.0 (технология SMARTSHADER 2.0 от ATI);
Поддержка полноэкранного сглаживания методом мультисэмплинга с числом субпикселов 2, 4 и 6 (технология SMOOTHVISION 2.0 от ATI);
Поддержка тесселляции полигонов, непрерывной и адаптивной тесселляции, N-патчей, карт смещения (технология TRUFORM 2.0 от ATI);
Поддержка технологии повышения эффективности использования пропускной способности памяти (технология HyperZ III от ATI).
2D-часть:
Задействование блоков пиксельных шейдеров для обработки видео (технология VIDEOSHADER от ATI);
Фильтрация артефактов компрессии MPEG4/DivX (технология FULLSTREAM от ATI);
Аппаратная декомпрессия DVD, адаптивный деинтерлейсинг, компенсация движения;
Вывод изображения в компонентном формате YPrPb;
Два CRT-контроллера;
Два встроенных RAMDAC с частотой 400 МГц;
Встроенный TMDS-трансивер с частотой преобразования 165 МГц;
Блок-схема:

14347

Характеристики нового чипа от ATI внушал уважение - это был настоящий "монстр": больше 100 миллионов транзисторов, тактовая частота за 300 МГц, 256-битная шина памяти, 8 пиксельных и 4 вершинных конвейеров, совместимость с DirectX9.

Пиксельные конвейеры.

В первую очередь бросается в глаза то, что для "урезанного" RV250 являлось нормой, но, кажется, никак не могло считаться нормальным для игрового ускорителя класса "high-end" - пиксельные конвейеры ATI RADEON 9700 имели всего по одному текстурному модулю.Однако, такое построение пиксельных конвейеров ATI R300 вполне оправдано.ATI RADEON 9700 имел вдвое большее по сравнению с видеокартами количество пиксельных конвейеров, что снижало остроту вопроса о недостаточной скорости текстурирования - лошадиных сил для того, чтобы достойно показать себя, у восьмицилиндрового движка R300 було достаточно .Во-вторых, текстурные модули R300 были способны за один такт выполнять выборку восьми текстурных сэмплов - по 4 сэмпла с двух соседних MIP-уровней, и производить трилинейную фильтрацию "бесплатно" в плане расхода тактов чипа.
В-третьих, наличие двух или более текстурных модулей в пиксельном конвейере вызвало бы увеличение количества данных, читаемых из текстур за такт, в два или более раза, и потребовало бы увеличения объема кэшей. В противном случае R300 оказалось бы недостаточно даже его 256-битной шины памяти - уже в существующем виде каждый из пиксельных конвейеров R300, скажем, при наложении 32-битной текстуры за такт запрашивал до 256 бит данных (8 текстурных сэмплов по 32 бита), все восемь конвейеров в сумме - 2048 бит.

HyperZ III

Для того, чтобы претендовать на лидерство среди игровых ускорителей класса "high-end", иметь высокую скорость заполнения и широкую шину памяти недостаточно. Необходимо эффективно использовать ресурсы графического чипа и шины памяти.
В ATI RADEON 9700 была реализована фирменная технология от ATI, HyperZ III. Задача этой технологии - избежать ненужной обработки пикселов, заведомо не подлежащих отрисовке, то есть, находящихся от наблюдателя дальше, чем уже прорисованные. Например, в том случае, когда какой-нибудь из полигонов частично или полностью закрывается другим, то часть пикселов дальнего полигона, закрываемую ближним полигоном, можно не прорисовывать. Таким образом графический чип избавляелся от значительного объема ненужной работы, вместе с тем повышаелась и эффективность использования доступной пропускной способности видеопамяти.

Hierarchical Z

Упрощенная реализация иерархического Z-буфера.
Идея иерархического Z-буфера достаточно проста: помимо самого Z-буфера организуется пирамида "Z-буферов пониженного разрешения", организованных наподобие MIP-уровней текстур.
Каждый из этих новых буферов имеет размеры, вдвое уменьшенные по горизонтали и вертикали по сравнению с предыдущим Z-буфером. При этом в каждое значение Z из буфера более низкого разрешения должно быть записано наибольшее из 4 соответствующих значений Z предыдущего буфера, имеющего более высокое разрешение.
ATI RADEON 9700, использовал пирамиду из трех уровней Z-буферов - привычный Z-буфер, служащий основанием этой пирамиды, и еще два уровня, имеющих размеры по горизонтали и вертикали, уменьшенные относительно стандартного Z-буфера, соответственно, в четыре и в восемь раз:

14363

Таким образом, в то время, как каждое значение стандартного Z-буфера соответствует одному пикселу изображения, значения из следующих уровней пирамиды хранят наибольшие величины Z из участков, содержащих, соответственно, 4х4 и 8х8 пикселов.

Fast Z Clear

Быстрая очистка Z-буфера.
После построения и вывода на экран изображения, та информация, что содержится в Z-буфере, уже не актуальна и подлежит стиранию. Проще говоря - между кадрами нужно обнулить Z-буфер.
RADEON 9700, по заявлениям ATI, обнуляет Z-буфер, записывая не отдельные значения, а блоки 8х8 - по 64 значения сразу.
Такое обнуление Z-буфера можно напрямую реализовать, имея на вооружении иерархический Z-буфер. Для инициализации всей пирамиды Z-буферов достаточно записать начальные значения лишь в Z-буфер самого низкого разрешения - дальше, при построении кадра, пирамида Z-буферов автоматически будет поддерживаться в актуальном состоянии. Таким образом, кстати, косвенно подтверждается высказанное ранее предположение о том, что "верхний" Z-буфер пирамиды Z-буферов пониженного разрешения на ATI RADEON 9700 соответствует блокам 8х8 пикселей.

Z Compression

Сжатие данных, читаемых из Z-буфера или записываемых в Z-буфер. Эффект сжатия данных, относящихся к Z-буферу, без потерь - результат действия Hierarchical Z. Помимо отбрасывания пикселей, не подлежащих обработке, Hierarchical Z эффективно снижает количество операций чтения и записи значений Z-буфера, составляющих немалую долю в общем потоке данных, передаваемых по шине памяти.

Новый контроллер памяти

На ATI RADEON 9700 установлен "расщепленный" на 4 канала контроллер памяти - это знакомо нам еще со времен NVIDIA GeForce3:

14349

По сути, в этом случае контроллер памяти представляет собой 4 независимых контроллера с шириной шины 64 бит у каждого. При этом суммарная ширина шины памяти составляет 256 бит.

Новый алгоритм анизотропной фильтрации текстур

При разработке нового чипа команда инженеров ATI учла все замечания, предъявляемые к качеству анизотропной фильтрации текстур на предыдущих чипах - это невозможность сочетать её с трилинейной фильтрацией текстур и неважное качество работы алгоритма на наклонных поверхностях.
Новый алгоритм анизотропной фильтрации текстур, являясь усовершенствованной версией старого, "быстрого" алгоритма от ATI, гораздо лучше работал на наклонных поверхностях и, наконец-то, позволял задействовать сочетание трилинейной и анизотропной фильтрации.

SMOOTHVISION 2.0

Новая технология полноэкранного сглаживания, SMOOTHVISION 2.0, реализованная в ATI RADEON 9700 PRO, являелась одной из разновидностей мультисэмплинга. В отличие от SMOOTHVISION на ATI RADEON 8500, 9000 / PRO, суперсэмплинга с расположением субпикселов на упорядоченной сетке (Ordered Grid Super Sampling, OGSS), ATI RADEON 9700 PRO при включении SMOOTHVISION 2.0 рассчитывала субпикселы только на границах полигонов, не выполняя дополнительной ненужной работы для пикселов, находящихся во "внутренностях" треугольников. То есть, теперь, наконец, и в чипе от ATI оказалась реализованной идея мультисэмплинга, впервые появившаяся еще в NVIDIA GeForce3.

VIDEOSHADER

Возможность задействования пиксельных шейдеров для обработки видеопотока компанией ATI была названа громким именем VIDEOSHADER.
Благодаря поддержке VIDEOSHADER, ATI RADEON 9700 избавлялась (а значит, становится чуть проще, надежнее и дешевле) от некоторых блоков, предназначенных специально для работы с видео, и вместо них использовала пиксельные шейдеры.

HYDRAVISION

Это слово знакомо нам еще с момента появления ATI RADEON VE. Технологией HYDRAVISION ATI называет поддержку мультимониторных конфигураций.
В этом плане ATI RADEON 9700 не имел никаких революционных изменений - как и предыдущие чипы, R300 поддерживал вывод изображения на два аналоговых монитора, один аналоговый + один цифровой, аналоговый монитор + телевизор, цифровой монитор + телевизор.

Пиксельные шейдеры

Пиксельные шейдеры DirectX9 версии 2.0 стали намного сложнее. Новые спецификации диктовали следующие требования к аппаратной части:
Использование в ходе выполнения шейдера данных из 16 текстур;
32 операции адресации;
64 арифметические операции;
16 регистров общего назначения;
16 регистров для хранения констант.

ATI RADEON 9700, как и положено DirectX9-совместимому ускорителю, этим требованиям полностью соответствовал.
Для сравнения - спецификации пиксельных шейдеров версии 1.4, чья аппаратная поддержка реализована в ATI RADEON 8500, 9000/PRO (R200, RV250):
Использование в ходе выполнения шейдера данных из 6 текстур;
2*6 операций адресации;
2*8 арифметических операций;
6 регистров общего назначения;
8 регистров для хранения констант

14358

Вершинные конвейеры ATI RADEON 9700, вершинные шейдеры версии 2.0

Вершинные шейдеры новой версии также значительно отличаются от спецификации вершинных шейдеров 1.1.Управление потоком команд:
Программы, выполняющиеся вершинными конвейерами Direct9-совместимого ускорителя - вершинные шейдеры - стали еще более близкими к привычному пониманию программами: в них появилась возможность управления потоком команд: циклы, условные и безусловные переходы, вызовы подпрограмм.

Больше команд, больше регистров:
В новой спецификации вершинных шейдеров длина программы увеличилась со 128 до 256 команд, количество регистров общего назначения - с 8 до 16, количество регистров для хранения констант - с 96 до 256.

В то время, как NVIDIA GeForce4 Ti и ATI RADEON 8500 имеют по два блока вершинных шейдеров, новый чип от ATI имел 4 четыре вершинных процессора, работающих параллельно.

14359

14360

 

Характеристики ATI Radeon 9700 PRO

 

Наименование Radeon 9700 PRO
Ядро R300
Техпроцесс (мкм) 0,15
Транзисторов (млн) 105
Частота работы ядра 325
Частота работы памяти (DDR) 310 (620)
Шина и тип памяти DDR-256 bit
ПСП (Гб/с) 19,8
Пиксельных конвейеров 8
TMU на конвейер 1
Текстур за такт 8
Текстур за проход 16
Вершинных конвейеров 4
Pixel Shaders 2.0
Vertex Shaders 2.0
Fill Rate (Mpix/s) 2600
Fill Rate (Mtex/s) 2600
DirectX 9.0
Anti-Aliasing (Max) MS - 6x
Анизотропная фильтрация (Max) 16x
Объем памяти 128 MB
Интерфейс AGP 8x
RAMDAC 2x400 MHz

На момент выхода ATI RADEON 9700 PRO стал высокопроизводительным игровым чипом из всех, что существовали на тот момент.Что характерно, производительность ATI RADEON 9700 PRO была настолько высока, что зачастую "слабым местом" в системе становился отнюдь не видеокарта, а процессор .

Unreal Tournament 2003

924

Комментарии (0)