gamegpu     Search find 4120

 tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

GeForce 9600 GT

21 февраля 208 года канадская компания официально представила видеокарту 9600 GT. Она была призвана отправить на "заслуженный покой" 8600 GTS в middle-end-сегменте в ценовой категории до 0. Новое ядро G94 отличается от своего старшего "брата" G92 лишь количественными характеристиками, а функциональное назначение и принцип действия исполнительных блоков остались без каких-либо значимых изменений. С точки зрения количественных характеристик 9600 GT имеет в запасе 64 универсальных процессора — это в два раза больше, чем у "старичка" 8600 GTS, и в два раза меньше, чем у GeForce 8800 GTS (G92) или GeForce 8800 GTX. На этот раз уже будем надеяться, что не произойдет такого колоссального разрыва в производительности по сравнению со старшими решениями, как это было между 8800 и 8600.
Итак, новоиспеченное ядро G94 состоит из 505 млн транзисторов (для сравнения: у G86 их было 210 млн, у G92 — 754 млн, у G80 — 681 млн). Оно работает на номинальной частоте 650 MHz для NVIDIA GeForce 9600 GTS. Графический процессор использует унифицированную шейдерную архитектуру, которая превосходно себя зарекомендовала в чипах G80/84/92. Идея унификации функциональных блоков GPU заключается в следующем: ранее они разделялись на вершинные и шейдерные, а теперь универсальные блоки способны обрабатывать любые виды инструкций без существенных потерь в производительности. Это позволит динамически изменять производительность ядра за счет перераспределения ресурсов для нужной в данный момент задачи. В итоге у нас получается полная загрузка чипа, и как следствие повышается производительность.
1992621 

В случае G94 мы видим элементарную редукцию — 4 шейдерных блока, в каждом из которых сосредоточены по 16 потоковых процессоров (Streaming Processor) и 8 текстурных блоков (TMU). Всего получается 64 потоковых процессора и 32 текстурных модуля. Все процессоры G94, как и в предыдущих чипах, работают с повышенными относительно GPU тактовыми частотами. В частности, для 9600 GT она равняется 1650 MHz. Напоследок отметим блоки записи в кадровый буфер (ROP), которых в данном случае 4 (на диаграмме синие блоки рядом с кэшем L2). В работе и концепции построения потоковых процессоров (SP) NVIDIA не вносила никаких поправок со времен чипов G84.

На каждые четыре потоковых процессора приходится два модуля адресации текстур TA и по два модуля фильтрации текстур TF. Поэтому теперь каждый текстурный блок в связи с увеличением числа вычисляемых текстурных адресов сможет обрабатывать вдвое больше выборок, чем таковой, к примеру, у G80. Каждый шейдерный блок снабжен собственным кэшем первого уровня L1. В нем могут храниться не только текстуры, но и в связи с унифицированностью самих блоков различного рода данные. Все потоковые процессоры (SP), на которых основана архитектура G94, являются скалярными. Почему не векторными? Причина кроется в том, что на основе исследований шейдерных программ разработчиками компании NVIDIA было выяснено, что векторная архитектура достаточно неэкономично использует вычислительные ресурсы, когда идет обработка сложных инструкций — например, скалярных и векторных одновременно (вообще говоря, скалярные вычисления на векторных процессорах выполняются очень неэффективно). В свете наметившейся в последнее время тенденции к все большему переходу от векторных вычислений к скалярным стратегия разработчиков NVIDIA, пожалуй, становится ясной. Ну, а что же делать с векторным программным кодом? Все очень просто: он преобразуются в скалярные операции непосредственно самим чипом G94. Как уже говорилось, у GeForce 9600 имеется в наличии 4 блока записи в кадровый буфер (ROP). Они не претерпели каких-либо изменений относительно архитектуры G92 и поддерживают следующие методы антиалиасинга: мультисэмплинг, суперсэмплинг и адаптивное сглаживание.

Характеристики NVIDIA GeForce 9600 GT

Наименование GeForce 9600 GT
Ядро G94 (D9P)
Техпроцесс (мкм) 0.065
Транзисторов (млн) 505
Частота работы ядра 650
Частота работы памяти (DDR) 900
Шина и тип памяти GDDR3 256-bit
ПСП (Гб/с) 57.60
Унифицированные шейдерные блоки 64
Частота унифицированных шейдерных блоков 1625
TMU на конвейер 32
ROP 16
Shaders Model 4.0
Fill Rate (Mpix/s) 10400
Fill Rate (Mtex/s) 20800
DirectX 10.0
Объем памяти 512/1024
Интерфейс PCI-E 2.0

Комментарии (0)