GeForce 9600 GT
В случае G94 мы видим элементарную редукцию — 4 шейдерных блока, в каждом из которых сосредоточены по 16 потоковых процессоров (Streaming Processor) и 8 текстурных блоков (TMU). Всего получается 64 потоковых процессора и 32 текстурных модуля. Все процессоры G94, как и в предыдущих чипах, работают с повышенными относительно GPU тактовыми частотами. В частности, для 9600 GT она равняется 1650 MHz. Напоследок отметим блоки записи в кадровый буфер (ROP), которых в данном случае 4 (на диаграмме синие блоки рядом с кэшем L2). В работе и концепции построения потоковых процессоров (SP) NVIDIA не вносила никаких поправок со времен чипов G84.
На каждые четыре потоковых процессора приходится два модуля адресации текстур TA и по два модуля фильтрации текстур TF. Поэтому теперь каждый текстурный блок в связи с увеличением числа вычисляемых текстурных адресов сможет обрабатывать вдвое больше выборок, чем таковой, к примеру, у G80. Каждый шейдерный блок снабжен собственным кэшем первого уровня L1. В нем могут храниться не только текстуры, но и в связи с унифицированностью самих блоков различного рода данные. Все потоковые процессоры (SP), на которых основана архитектура G94, являются скалярными. Почему не векторными? Причина кроется в том, что на основе исследований шейдерных программ разработчиками компании NVIDIA было выяснено, что векторная архитектура достаточно неэкономично использует вычислительные ресурсы, когда идет обработка сложных инструкций — например, скалярных и векторных одновременно (вообще говоря, скалярные вычисления на векторных процессорах выполняются очень неэффективно). В свете наметившейся в последнее время тенденции к все большему переходу от векторных вычислений к скалярным стратегия разработчиков NVIDIA, пожалуй, становится ясной. Ну, а что же делать с векторным программным кодом? Все очень просто: он преобразуются в скалярные операции непосредственно самим чипом G94. Как уже говорилось, у GeForce 9600 имеется в наличии 4 блока записи в кадровый буфер (ROP). Они не претерпели каких-либо изменений относительно архитектуры G92 и поддерживают следующие методы антиалиасинга: мультисэмплинг, суперсэмплинг и адаптивное сглаживание.
Характеристики NVIDIA GeForce 9600 GT
Наименование | GeForce 9600 GT |
Ядро | G94 (D9P) |
Техпроцесс (мкм) | 0.065 |
Транзисторов (млн) | 505 |
Частота работы ядра | 650 |
Частота работы памяти (DDR) | 900 |
Шина и тип памяти | GDDR3 256-bit |
ПСП (Гб/с) | 57.60 |
Унифицированные шейдерные блоки | 64 |
Частота унифицированных шейдерных блоков | 1625 |
TMU на конвейер | 32 |
ROP | 16 |
Shaders Model | 4.0 |
Fill Rate (Mpix/s) | 10400 |
Fill Rate (Mtex/s) | 20800 |
DirectX | 10.0 |
Объем памяти | 512/1024 |
Интерфейс | PCI-E 2.0 |