gamegpu     Search find 4120

 tg2 f2 lin2 in2 X icon 3 y2  p2 tik steam2

GeForce GTX 960

960

NVIDIA с видеокартой GeForce GTX 960 перенесла преимущества архитектуры "Maxwell" на массовый рынок. Видеокарты получили такие плюсы архитектуры, как сжатие памяти, DSR, MFAA, VXGI и DirectX 12. Для NVIDIA всё большее значение имеют собственные API GameWorks и PhysX, новостей по этому поводу пока нет, но от их поддержки выиграют и покупатели GeForce GTX 960.

У видеокарты GeForce GTX 960 используется GPU GM206, вероятно, не в полной версии – под маркировкой GM206-300-A1. Кристалл оснащён 2,94 млрд. транзисторов, он существенно менее сложный, чем "Tahiti" или "Tonga" от AMD. Поскольку эталонной видеокарты GeForce GTX 960 не представлено, информация о базовой частоте и Boost в таблице выше практического значения не имеет. NVIDIA указывает базовую частоту 1.126 МГц, а частоту GPU Boost – 1.178 МГц. 2.048 Мбайт памяти GDDR5 NVIDIA выставила на 1.750 МГц, память подключена по 128-битному интерфейсу. В результате мы получаем пропускную способность памяти 112,2 Гбайт/с – немного по сравнению с конкурентами. Но не забывайте, что NVIDIA использует технологию сжатия памяти, которая теоретически увеличивает эффективную пропускную способность памяти, но обещанные NVIDIA 148,8 Гбайт/с всё равно достигаются в редких случаях.

diag 1

GPU GM206 опирается на 1.024 потоковых процессора, которые объединены в восемь блоков SMM (streaming multiprocessors), по 4x 32 потоковых процессора в каждом. Четыре SMM составляют кластер GPC, мы получаем два таких кластера на GPU. 8 (SMM) x 4 (блока SMM) x 32 потоковых процессора как раз дают 1.024 потоковых процессора.

В каждом SMM используется восемь текстурных блоков. Соответственно, восемь SMM у GeForce GTX 960 дают 64 текстурных блока. Два 64-битных контроллера памяти подключен к 32 конвейерам растровых операций (ROP).

smm

Более высокую эффективность Maxwell NVIDIA смогла получить благодаря нескольким решениям. Кэш L2 в архитектуре "Maxwell" был увеличен до 2.048 кбайт по сравнению с 256 кбайт в архитектуре "Kepler". Пропускная способность кэша осталась на уровне 512 байт на такт. По сравнению с архитектурой Maxwell первого поколения была несколько увеличена общая память для каждого мультипроцессора SMM. Теперь она составляет уже 96 кбайт, а не 64 кбайт. Можно отметить и новый движок Polymorph Engine версии 3.0.

Движок PolyMorph 3.0 отвечает за запросы текстур, тесселяцию, настройку атрибутов, трансформацию поля зрения и потоковый вывод. Результаты вычислений кластера SMM и движка PolyMorph 3.0 затем передаются на движок растеризации. На втором этапе тесселятор начинает расчеты позиций поверхностей, в зависимости от расстояния выбирается нужный уровень детализации. Скорректированные значения отсылаются на кластер SMM, где с ними работают доменные и геометрические шейдеры. Доменный шейдер рассчитывает финальную позицию каждого треугольника, учитывая данные Hull-шейдеров и тесселяторов. На данном этапе накладываются карты смещения. Геометрический шейдер затем сравнивает рассчитанные данные с действительно видимыми объектами и отсылает результаты обратно на движок тесселяции для окончательного расчета. На последнем этапе движок PolyMorph 3.0 выполняет трансформацию поля зрения и коррекцию перспективы. Наконец, рассчитанные данные выводятся через потоковый вывод, память освобождается для дальнейших расчетов.

Перейдём к отдельным блокам мультипроцессора SMM. Каждый блок из 32 потоковых процессоров оснащен буфером инструкций и warp-планировщиком. Два блока диспетчеризации работают с 16.384 32-битными регистрами каждый. Если посмотреть на архитектуру "Kepler", то 192 потоковых процессора работали с четырьмя warp-планировщиками и восемью блоками диспетчеризации, всего было доступно 65.536 32-битных регистров. Теоретически на каждый потоковый процессор в архитектуре "Maxwell" приходятся 512 регистров, у "Kepler" их количество составляло около 341. Эта мера тоже способствовала приросту производительности потоковых процессоров до 35%.

Характеристики GeForce GTX 960

 Дата релиза  22 января 2015 года
 Стартовая цена, $  199

Чип

 Модель GPU 28nm GM206-300
 Ядра:TMUs : ROPs 1024 : 64 : 32

Частоты

 Частота GPU(boost), МГц 1127(1178)
 Частота памяти(эффективная), МГц 1753 (7012)
 Производительность FP32, GFLOPS 2,308

Память

 Объём видеопамяти, мб  2048/4096
 Шина памяти, ,бит  128
 Пропускная способность памяти, GB/s  112

Интеррфейс и TDP

 Интерфейс PCI-Express  3.0 x16
 TDP. Вт 120

Также несколько изменилось соотношение между потоковыми процессорами и так называемыми специальными функциональными блоками (Special Function Units, SFU). В архитектуре "Kepler" соотношение составляло 6/1, в " Maxwell" оно снизилось до 4/1. То же самое касается и соотношения потоковых процессоров и блоков чтения/записи (Load/Store, LD/ST). Специальные блоки вычислений с двойной точностью на диаграмме не показаны, они, скорее всего, будут представлены в GPU GM210 (по аналогии между GK110 и GK104). Но, если верить NVIDIA, соотношение одиночной и двойной точности составляет 1/24, как и в чипах "Kepler" первого поколения (GK104).

Небольшие изменения по сравнению с предыдущей реализацией архитектуры "Maxwell" произошли в движке обработки видео (Video Engine). Теперь он обеспечивает не только аппаратное кодирование в H.265, но и аппаратное декодирование. У GeForce GTX 980 и GeForce GTX 970 также отсутствовала поддержка HDCP в HDMI 2.2, в GeForce GTX 960 и GPU GM206 она была добавлена.

 

 

Комментарии (0)