GeForce FX 5900 Ultra особенности архитектуры

Основные отличия от GeForce FX 5800 Ultra
Чип из 135 миллионов транзисторов: количество транзисторов в чипе увеличилось ненамного - это косвенно говорило о том, что изменения в чипе, базирующемся на архитектуре NV30, скорее косметические.
256-битный интерфейс локальной памяти: Пожалуй, самое ожидаемое нововведение в NV35. С момента выпуска NV30 энтузиасты трехмерной графики на ПК, предсказывая характеристики NV35, даже не представляли себе этот чип без 256-битного интерфейса обмена с локальной памятью.
4 усовершенствованных конвейеризированных пиксельных процессора: Здесь же вместо также ожидаемого увеличения числа пиксельных процессоров до 8 NVIDIA оставила все те же 4 процессора. Каждый из пиксельных процессоров был снабжен: двумя блоками, фильтрующими текстуры, двумя смешанными целочисленными и работающими с плавающей точкой операциями ALU и одним ALU, выполняющим операции только. с плавающей точкой. То есть, всего три операции с плавающей точкой. Такая конфигурация позволяла выполнять до 12 пиксельных операций за такт. Однако, в силу некоторых обстоятельств, эта мощь работала только в OpenGL, в D3D было по-прежнему - только одна операция с плавающей точкой. Разумеется, декларировалось, что по мощности пиксельных процессоров при выполнении пиксельных шейдеров DirectX9 PS 2.0 со 128 битной точностью вычислений новый чип превосходил NV30 в два раза.
Технология Intellisample HCT: техника экономии пропускной полосы локальной памяти: сжатие без потерь буфера кадра, включая как информацию о цвете, так и из буфера глубины (Z буфера). Возможный коэффициент сжатия - до 4:1. По сравнению с NV30 технология Intellisample была усовершенствованна - как и ранее в чипе на основании нескольких факторов определяелся, будет ли эффект от сжатия передаваемых блоков данных, но теперь, в результате оптимизации, вероятность сжатия данных была увеличена. Также под общим названием Intellisample HCT были включены следующие техники, увеличивающие эффективность работы с локальной памятью: контроллер локальной памяти с коммутатором, текстурные кэши, раннее отсечение невидимых пикселей (z-culling), быстрая очистка буфера глубины (fast z-clear). Все эти оптимизации позволяли существенно снизить падение производительности при активации FSАА.
Технология UltraShadow: Данная технология позволяла увеличить скорость визуализации теней при использовании техники стенсил-буфера (stencil buffer shadows), как раз той техники, которая используовалась в Doom III. Как часть технологии UltraShadow декларировалась возможность чипов NV30/NV35 удваивать fillrate, выдавая до 8 пикселей за такт, если закрашивается только буфер глубины и/или стенсил буфер, по сравнению с 4 пикселями при обычном рендеринге. Вторая, наиболее интересная часть заключалась в возможности задавать диапазон глубины в кадре, в котором объект может отбрасывать тень. Для демонстрации взглянем на рисунок:
Если при прорисовке теней значение глубины пикселя, хранящееся в буфере глубины, не попадало в заданный диапазон, то стенсил-буфер для пикселя не обновлялся. Таким образом, становилась возможной экономия достаточно большого процента от скорости закраски (fillrate). По всей видимости, для реализации этой функции в чипе был усовершенствован блок, отвечающий за раннее отбрасывание невидимых поверхностей (early z-cull), который теперь сверял значение, хранящееся в буфере глубины, не только с текущим значением, интерполированным исходя из координат треугольника, но и с двумя дополнительными значениями. В итоге выигрыш по сравнению с другими чипами с одинаковым количеством конвейеров был двукратный в худшем случае (8 значений буфера глубины по сравнению с 4 значениями цвета) и четырехкратный (с учетом, что early z-cull мог отбрасывать до 16 пикселей за такт), даже без учета уменьшения объема данных, записываемых обратно в локальную память.
Характеристики NVIDIA GeForce FX 5900 Ultra
Наименование | GeForce FX 5900 Ultra |
Ядро | NV35 |
Техпроцесс (мкм) | 0,13 |
Транзисторов (млн) | 135 |
Частота работы ядра | 450 |
Частота работы памяти (DDR) | 425 (850) |
Шина и тип памяти | DDR-256 bit |
ПСП (Гб/с) | 27,2 |
Пиксельных конвейеров | 8 (4) |
TMU на конвейер | 1 (2) |
Текстур за такт | 8 |
Текстур за проход | 16 |
Вершинных конвейеров | 3 |
Pixel Shaders | 2+ |
Vertex Shaders | 2+ |
Fill Rate (Mpix/s) | 3600 |
Fill Rate (Mtex/s) | 3600 |
DirectX | 9+ |
Anti-Aliasing (Max) | SS & MS - 8x |
Анизотропная фильтрация (Max) | 8x |
Объем памяти | 256 MB |
Интерфейс | AGP 8x |
RAMDAC | 2x400 MHz |
NV35 не дополнял существующую линейку от NVIDIA, а заменял собой неудачную серию NV30. Именно так назвал NV30 даже президент NVIDIA. Именно поэтому даже кодовое имя не соответствует тому, что мы видим, ведь ранее NV*5 — это плановое улучшение предыдущего поколения, несущее в себе не только работу над ошибками, но и приличные приросты по скорости, а также усовершенствования архитектуры.
Knights of the Old Republic