gamegpu     Search find 4120

 tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

GeForce FX 5900 Ultra особенности архитектуры

2238_1
NV35 - это был не выпуск просто новой линейки, которая (как ранее было) смещала с трона предыдушие продукты, переводя их на ступень ниже, а ЗАМЕЩЕНИЕ предыдущего продукта NV30.
И в этом коренное отличие от ранее вышедших тандемов: NV10-NV15 (GeForce256-GeForce2), NV20-NV25 (GeForce3-GeForce4Ti). Да, разумеется, целью NVIDIA и тогда была замена продуктов GeForce256 и GeForce3, однако она шла постепенно и в штатном режиме продаж. А тут было все иначе, предыдущий продукт появляется в продаже, и буквально через месяц анонсируется новый. Разумеется, фирмы-производители обо всем знали заранее, и потому на выпуск NV30 клюнули немногие, а кто и решился, тот выпустил мизерное количество таких карт. Это объяснялось еще и высочайшей себестоимостью GF FX 5800/Ultra. 

Основные отличия от GeForce FX 5800 Ultra

Чип из 135 миллионов транзисторов: количество транзисторов в чипе увеличилось ненамного - это косвенно говорило о том, что изменения в чипе, базирующемся на архитектуре NV30, скорее косметические.
256-битный интерфейс локальной памяти: Пожалуй, самое ожидаемое нововведение в NV35. С момента выпуска NV30 энтузиасты трехмерной графики на ПК, предсказывая характеристики NV35, даже не представляли себе этот чип без 256-битного интерфейса обмена с локальной памятью.
4 усовершенствованных конвейеризированных пиксельных процессора: Здесь же вместо также ожидаемого увеличения числа пиксельных процессоров до 8 NVIDIA оставила все те же 4 процессора. Каждый из пиксельных процессоров был снабжен: двумя блоками, фильтрующими текстуры, двумя смешанными целочисленными и работающими с плавающей точкой операциями ALU и одним ALU, выполняющим операции только. с плавающей точкой. То есть, всего три операции с плавающей точкой. Такая конфигурация позволяла выполнять до 12 пиксельных операций за такт. Однако,  в силу некоторых обстоятельств, эта мощь работала только в OpenGL, в D3D было по-прежнему - только одна операция с плавающей точкой. Разумеется, декларировалось, что по мощности пиксельных процессоров при выполнении пиксельных шейдеров DirectX9 PS 2.0 со 128 битной точностью вычислений новый чип превосходил NV30 в два раза.
Технология Intellisample HCT: техника экономии пропускной полосы локальной памяти: сжатие без потерь буфера кадра, включая как информацию о цвете, так и из буфера глубины (Z буфера). Возможный коэффициент сжатия - до 4:1. По сравнению с NV30 технология Intellisample была усовершенствованна - как и ранее в чипе на основании нескольких факторов определяелся, будет ли эффект от сжатия передаваемых блоков данных, но теперь, в результате оптимизации, вероятность сжатия данных была увеличена. Также под общим названием Intellisample HCT были включены следующие техники, увеличивающие эффективность работы с локальной памятью: контроллер локальной памяти с коммутатором, текстурные кэши, раннее отсечение невидимых пикселей (z-culling), быстрая очистка буфера глубины (fast z-clear). Все эти оптимизации позволяли существенно снизить падение производительности при активации FSАА.
Технология UltraShadow: Данная технология позволяла увеличить скорость визуализации теней при использовании техники стенсил-буфера (stencil buffer shadows), как раз той техники, которая используовалась в Doom III. Как часть технологии UltraShadow декларировалась возможность чипов NV30/NV35 удваивать fillrate, выдавая до 8 пикселей за такт, если закрашивается только буфер глубины и/или стенсил буфер, по сравнению с 4 пикселями при обычном рендеринге. Вторая, наиболее интересная часть заключалась в возможности задавать диапазон глубины в кадре, в котором объект может отбрасывать тень. Для демонстрации взглянем на рисунок:

depthbounds

Если при прорисовке теней значение глубины пикселя, хранящееся в буфере глубины, не попадало в заданный диапазон, то стенсил-буфер для пикселя не обновлялся. Таким образом, становилась возможной экономия достаточно большого процента от скорости закраски (fillrate). По всей видимости, для реализации этой функции в чипе был усовершенствован блок, отвечающий за раннее отбрасывание невидимых поверхностей (early z-cull), который теперь сверял значение, хранящееся в буфере глубины, не только с текущим значением, интерполированным исходя из координат треугольника, но и с двумя дополнительными значениями. В итоге выигрыш по сравнению с другими чипами с одинаковым количеством конвейеров был двукратный в худшем случае (8 значений буфера глубины по сравнению с 4 значениями цвета) и четырехкратный (с учетом, что early z-cull мог отбрасывать до 16 пикселей за такт), даже без учета уменьшения объема данных, записываемых обратно в локальную память.


Характеристики NVIDIA GeForce FX 5900 Ultra

Наименование GeForce FX 5900 Ultra
Ядро NV35
Техпроцесс (мкм) 0,13
Транзисторов (млн) 135
Частота работы ядра 450
Частота работы памяти (DDR) 425 (850)
Шина и тип памяти DDR-256 bit
ПСП (Гб/с) 27,2
Пиксельных конвейеров 8 (4)
TMU на конвейер 1 (2)
Текстур за такт 8
Текстур за проход 16
Вершинных конвейеров 3
Pixel Shaders 2+
Vertex Shaders 2+
Fill Rate (Mpix/s) 3600
Fill Rate (Mtex/s) 3600
DirectX 9+
Anti-Aliasing (Max) SS & MS - 8x
Анизотропная фильтрация (Max) 8x
Объем памяти 256 MB
Интерфейс AGP 8x
RAMDAC 2x400 MHz

NV35 не дополнял существующую линейку от NVIDIA, а заменял собой неудачную серию NV30. Именно так назвал NV30 даже президент NVIDIA. Именно поэтому даже кодовое имя не соответствует тому, что мы видим, ведь ранее NV*5 — это плановое улучшение предыдущего поколения, несущее в себе не только работу над ошибками, но и приличные приросты по скорости, а также усовершенствования архитектуры.

Knights of the Old Republic

knightsss4

Комментарии (0)