GeForce GTX 960
NVIDIA с видеокартой GeForce GTX 960 перенесла преимущества архитектуры "Maxwell" на массовый рынок. Видеокарты получили такие плюсы архитектуры, как сжатие памяти, DSR, MFAA, VXGI и DirectX 12. Для NVIDIA всё большее значение имеют собственные API GameWorks и PhysX, новостей по этому поводу пока нет, но от их поддержки выиграют и покупатели GeForce GTX 960.
У видеокарты GeForce GTX 960 используется GPU GM206, вероятно, не в полной версии – под маркировкой GM206-300-A1. Кристалл оснащён 2,94 млрд. транзисторов, он существенно менее сложный, чем "Tahiti" или "Tonga" от AMD. Поскольку эталонной видеокарты GeForce GTX 960 не представлено, информация о базовой частоте и Boost в таблице выше практического значения не имеет. NVIDIA указывает базовую частоту 1.126 МГц, а частоту GPU Boost – 1.178 МГц. 2.048 Мбайт памяти GDDR5 NVIDIA выставила на 1.750 МГц, память подключена по 128-битному интерфейсу. В результате мы получаем пропускную способность памяти 112,2 Гбайт/с – немного по сравнению с конкурентами. Но не забывайте, что NVIDIA использует технологию сжатия памяти, которая теоретически увеличивает эффективную пропускную способность памяти, но обещанные NVIDIA 148,8 Гбайт/с всё равно достигаются в редких случаях.
GPU GM206 опирается на 1.024 потоковых процессора, которые объединены в восемь блоков SMM (streaming multiprocessors), по 4x 32 потоковых процессора в каждом. Четыре SMM составляют кластер GPC, мы получаем два таких кластера на GPU. 8 (SMM) x 4 (блока SMM) x 32 потоковых процессора как раз дают 1.024 потоковых процессора.
В каждом SMM используется восемь текстурных блоков. Соответственно, восемь SMM у GeForce GTX 960 дают 64 текстурных блока. Два 64-битных контроллера памяти подключен к 32 конвейерам растровых операций (ROP).
Более высокую эффективность Maxwell NVIDIA смогла получить благодаря нескольким решениям. Кэш L2 в архитектуре "Maxwell" был увеличен до 2.048 кбайт по сравнению с 256 кбайт в архитектуре "Kepler". Пропускная способность кэша осталась на уровне 512 байт на такт. По сравнению с архитектурой Maxwell первого поколения была несколько увеличена общая память для каждого мультипроцессора SMM. Теперь она составляет уже 96 кбайт, а не 64 кбайт. Можно отметить и новый движок Polymorph Engine версии 3.0.
Движок PolyMorph 3.0 отвечает за запросы текстур, тесселяцию, настройку атрибутов, трансформацию поля зрения и потоковый вывод. Результаты вычислений кластера SMM и движка PolyMorph 3.0 затем передаются на движок растеризации. На втором этапе тесселятор начинает расчеты позиций поверхностей, в зависимости от расстояния выбирается нужный уровень детализации. Скорректированные значения отсылаются на кластер SMM, где с ними работают доменные и геометрические шейдеры. Доменный шейдер рассчитывает финальную позицию каждого треугольника, учитывая данные Hull-шейдеров и тесселяторов. На данном этапе накладываются карты смещения. Геометрический шейдер затем сравнивает рассчитанные данные с действительно видимыми объектами и отсылает результаты обратно на движок тесселяции для окончательного расчета. На последнем этапе движок PolyMorph 3.0 выполняет трансформацию поля зрения и коррекцию перспективы. Наконец, рассчитанные данные выводятся через потоковый вывод, память освобождается для дальнейших расчетов.
Перейдём к отдельным блокам мультипроцессора SMM. Каждый блок из 32 потоковых процессоров оснащен буфером инструкций и warp-планировщиком. Два блока диспетчеризации работают с 16.384 32-битными регистрами каждый. Если посмотреть на архитектуру "Kepler", то 192 потоковых процессора работали с четырьмя warp-планировщиками и восемью блоками диспетчеризации, всего было доступно 65.536 32-битных регистров. Теоретически на каждый потоковый процессор в архитектуре "Maxwell" приходятся 512 регистров, у "Kepler" их количество составляло около 341. Эта мера тоже способствовала приросту производительности потоковых процессоров до 35%.
Характеристики GeForce GTX 960
|
||||||
Чип
|
||||||
Частоты
|
||||||
Память
|
||||||
Интеррфейс и TDP
|
Также несколько изменилось соотношение между потоковыми процессорами и так называемыми специальными функциональными блоками (Special Function Units, SFU). В архитектуре "Kepler" соотношение составляло 6/1, в " Maxwell" оно снизилось до 4/1. То же самое касается и соотношения потоковых процессоров и блоков чтения/записи (Load/Store, LD/ST). Специальные блоки вычислений с двойной точностью на диаграмме не показаны, они, скорее всего, будут представлены в GPU GM210 (по аналогии между GK110 и GK104). Но, если верить NVIDIA, соотношение одиночной и двойной точности составляет 1/24, как и в чипах "Kepler" первого поколения (GK104).
Небольшие изменения по сравнению с предыдущей реализацией архитектуры "Maxwell" произошли в движке обработки видео (Video Engine). Теперь он обеспечивает не только аппаратное кодирование в H.265, но и аппаратное декодирование. У GeForce GTX 980 и GeForce GTX 970 также отсутствовала поддержка HDCP в HDMI 2.2, в GeForce GTX 960 и GPU GM206 она была добавлена.