Russian Chinese (Simplified) English French German Ukrainian

Вулкан

GeForce 9600 GT

21 февраля 208 года канадская компания официально представила видеокарту 9600 GT. Она была призвана отправить на "заслуженный покой" 8600 GTS в middle-end-сегменте в ценовой категории до 0. Новое ядро G94 отличается от своего старшего "брата" G92 лишь количественными характеристиками, а функциональное назначение и принцип действия исполнительных блоков остались без каких-либо значимых изменений. С точки зрения количественных характеристик 9600 GT имеет в запасе 64 универсальных процессора — это в два раза больше, чем у "старичка" 8600 GTS, и в два раза меньше, чем у GeForce 8800 GTS (G92) или GeForce 8800 GTX. На этот раз уже будем надеяться, что не произойдет такого колоссального разрыва в производительности по сравнению со старшими решениями, как это было между 8800 и 8600.
Итак, новоиспеченное ядро G94 состоит из 505 млн транзисторов (для сравнения: у G86 их было 210 млн, у G92 — 754 млн, у G80 — 681 млн). Оно работает на номинальной частоте 650 MHz для NVIDIA GeForce 9600 GTS. Графический процессор использует унифицированную шейдерную архитектуру, которая превосходно себя зарекомендовала в чипах G80/84/92. Идея унификации функциональных блоков GPU заключается в следующем: ранее они разделялись на вершинные и шейдерные, а теперь универсальные блоки способны обрабатывать любые виды инструкций без существенных потерь в производительности. Это позволит динамически изменять производительность ядра за счет перераспределения ресурсов для нужной в данный момент задачи. В итоге у нас получается полная загрузка чипа, и как следствие повышается производительность.
1992621 

В случае G94 мы видим элементарную редукцию — 4 шейдерных блока, в каждом из которых сосредоточены по 16 потоковых процессоров (Streaming Processor) и 8 текстурных блоков (TMU). Всего получается 64 потоковых процессора и 32 текстурных модуля. Все процессоры G94, как и в предыдущих чипах, работают с повышенными относительно GPU тактовыми частотами. В частности, для 9600 GT она равняется 1650 MHz. Напоследок отметим блоки записи в кадровый буфер (ROP), которых в данном случае 4 (на диаграмме синие блоки рядом с кэшем L2). В работе и концепции построения потоковых процессоров (SP) NVIDIA не вносила никаких поправок со времен чипов G84.

На каждые четыре потоковых процессора приходится два модуля адресации текстур TA и по два модуля фильтрации текстур TF. Поэтому теперь каждый текстурный блок в связи с увеличением числа вычисляемых текстурных адресов сможет обрабатывать вдвое больше выборок, чем таковой, к примеру, у G80. Каждый шейдерный блок снабжен собственным кэшем первого уровня L1. В нем могут храниться не только текстуры, но и в связи с унифицированностью самих блоков различного рода данные. Все потоковые процессоры (SP), на которых основана архитектура G94, являются скалярными. Почему не векторными? Причина кроется в том, что на основе исследований шейдерных программ разработчиками компании NVIDIA было выяснено, что векторная архитектура достаточно неэкономично использует вычислительные ресурсы, когда идет обработка сложных инструкций — например, скалярных и векторных одновременно (вообще говоря, скалярные вычисления на векторных процессорах выполняются очень неэффективно). В свете наметившейся в последнее время тенденции к все большему переходу от векторных вычислений к скалярным стратегия разработчиков NVIDIA, пожалуй, становится ясной. Ну, а что же делать с векторным программным кодом? Все очень просто: он преобразуются в скалярные операции непосредственно самим чипом G94. Как уже говорилось, у GeForce 9600 имеется в наличии 4 блока записи в кадровый буфер (ROP). Они не претерпели каких-либо изменений относительно архитектуры G92 и поддерживают следующие методы антиалиасинга: мультисэмплинг, суперсэмплинг и адаптивное сглаживание.

Характеристики NVIDIA GeForce 9600 GT

Наименование GeForce 9600 GT
Ядро G94 (D9P)
Техпроцесс (мкм) 0.065
Транзисторов (млн) 505
Частота работы ядра 650
Частота работы памяти (DDR) 900
Шина и тип памяти GDDR3 256-bit
ПСП (Гб/с) 57.60
Унифицированные шейдерные блоки 64
Частота унифицированных шейдерных блоков 1625
TMU на конвейер 32
ROP 16
Shaders Model 4.0
Fill Rate (Mpix/s) 10400
Fill Rate (Mtex/s) 20800
DirectX 10.0
Объем памяти 512/1024
Интерфейс PCI-E 2.0

 

Для того чтобы оставлять комментарии Вам нужно пройти авторизацию

Google