vk4   ut  steam  fc   inst  яндекс дзен   ridit

GeForce FX 5800 Ultra особенности архитектуры

18 ноября 2002 года компания nVidia представила новый графический чип GeForce FX, известный ранее под кодовым названием NV30. Прежде всего, стоит особо остановится наторговой марке GeForce FX. Относительно того, что такое «FX» в Сети существовало множество версий, в переводе на русский «FX» обозначает «спецэффекты». Как известно, в составе nVidia после приобретения 3dfx работала масса её бывших сотрудников . Новый GeForce стал кульминационным продуктом, в котором использована масса их разработок, о чём недвусмысленно было сказано на презентации продукта.
shapka2

Если смотреть шире, то можно предположить, что выбирая новую торговую марку в столь непростые времена, маркетологи nVidia явно неспроста решили воскресить в памяти обывателей 3dfx. В PR-отделе компании предпологали что подобный шаг скажется на популярности акселераторов. Возможно, nVidia решила наконец, что продолжать наращивать номера в линейке GeForce невыгодно - разница между GeForce 3 и 4 была не столь велика, а то, что младший чип носит название GeForce 4 MX, и благодаря этому, тоже относится к линейке "четвёртых джифорсов", можно вообще считать ошибкой отдела маркетинга.

nv30_moscow_061

Фактически, назвав новый продукт GeForce FX, nVidia пыталась выделить чип в отдельный класс, подчеркнуть его инновационность и революционность. На первый взгляд, для этого были реальные предпосылки.NVIDIA перенесла в NV30 программируемую основу на более высокий уровень по сравнению с GPU предыдущих поколений. Новые команды обработки вершин представлены логарифмическими и тригонометрическими функциями высокой точности. Фактически, число инструкций, поддерживаемых анонсированной архитектурой, увеличилось от 128 в nfiniteFX до 65536 в CineFX. Это даёт разработчикам фантастическую возможность создавать большее количество эффектов при использовании более простых методов программирования. Возьмём к примеру Zoltar - технологическую демонстрацию для GeForce3. Чтобы создать подобную реалистичную кожу и костную структуру, необходимо использовать несколько шейдеров. Для достижения такого же результата используя архитектуру CineFX, достаточно былолишь одного.

Улучшенные пиксельные шейдеры

Теперь с появлением FX обработка пикселя была поднята к тому же уровню важности, как и обработка вершины. Например, многие из команд, используемых исключительно для обработки вершины теперь стали доступны для обработки пикселя, и сами программы управления будут по размеру больше (до 1024 команд). И в то время, как GeForce3 был ограничен до четырёх текстур в пиксель, NV30 поддерживалт до 16. Наконец, количество операций над пикселем было решительно увеличено: в DirectX 8 стоит ограничение на 8 операций,а в DirectX 9 была заявлена поддержка 64 действий, а NV30 поддерживает до 1024 операций с текстурой. Это включало такие продвинутые команды как "swizzling" (настройка по адресам) и "conditional write masks" (условные маски записи).В результате указанных улучшений разработчики получили возможность большего контроля на пиксельном уровне, что безусловно положительно сказалось на реалистичности графики.

motocycle1

Повышенная цветовая точность

Другое усовершенствование, представленное с NV3X - поддержка 64- и 128-битного представления цвета (16- или 32-разрядная с плавающей запятой для каждого RGB компонента). Это нововведение хорошо отразилось на изображениях с высоким диапазоном яркости. Такая возможность уже давно была реализована в профессиональных 3D приложениях в виде стандарта HDRI (High Dynamic Range Image), например, для 3D Max'а и применяется в трёхмерной визуализации сцены рендером Brazil.

b02x_hdri_3801
С более широким цветовым диапазоном артефакты были устранены. Но за 128 битный цвет придшлось щедро расплачиваться аппаратными ресурсами, в первую очередь пропускной способностью шины данных.

Cg: язык программирования "Си" для графики

Одним из ключевых элементов стратегии nVidia по популяризации программирования графических приложений стал язык Cg. Cg это язык программирования высокого уровня, благодаря которому nVidia пыталась облегчить процесс разработки новых программ, сделать этот процесс доступным не только для набивших руку специалистов вроде Джона Кармака, но и для начинающих. В перспективе, это позволил сделать приложения еще более гибкими и мощными. Cg поддерживает как Direct3D, так и OpenGL, и при этом позволяет обеспечить совместимость с ранними моделями графических чипов.

На SIGGRAPH был продемонстрирован пример, в котором программа для пиксельных шейдеров, состоящая всего из двух строк на Cg, делала то же самое, что и внушительная порция кода из 23 строк на ассемблере. Использовать Cg для программирования продвинутых графических эффектов сможет даже начинающий программист. Да и разобраться с языком высокого уровня всегда проще, чем с ассемблером и специфичными командами акселератора. Исторически доказано, что языки высокого уровня стимулируют и популяризую разработку программ. Кстати, компилятор языка Cg распространяелся под лицензией Open Source, что также положительно должно сказалось на его популярности.

AGP 8x

Увеличение полосы пропускания между системной памятью, процессором и графическим чипом - была ключевая цель архитектуры NV3x. Чип поддерживал AGP8x, то есть вдвое большую полосу пропускания графической шины. AGP8x обеспечивал скорость в 2 Гб в секунду, в то время как AGP4x всего 1 Гб/c. В итоге, станло возможным передавать еще больше данных в акселератор, полнее и быстрее загрузить его текстурами, сложными геометрическими моделями и другими данными.

Но не стоило преувеличивать роль AGP 8x в системе. Видимая польза от нового интерфейса проявила себя не скоро. Игры, оптимизированные на то поколение оборудования, от AGP 8x получали немногое. И только тогда, когда большая часть парка ПК стала совместима с новым интерфейсом приложения стали быстрее работать на AGP 8x, нежели на AGP 2x/4x системах.

Технологический процесс 0.13 микрон

Ядро NV30 будет производилось с использованием нового процесса 0.13 микрон. Для сравнения, старшие модели NV25, или попросту GeForce 4, производились по 0.15 микронному процессу. Более "тонкий" процесс производства позволил разместить больше транзисторов на чипе, увеличить частоту, уменьшить энергопотребление и тепловыделение. Кстати, и топовый продукт ATi Raden 9700 тоже изготавливался по 0.15 микронной технологии.

Поддержка DDR-II

Одной из особенностей нового чипа, вызвавшей большой ажиотаж,стала базовая поддержка памяти DDR второго поколения. Так называемая DDR-II стала ключевым образом сказываться на производительности акселератора. Известно, что именно производительность подсистемы памяти графической карты зачастую определяет производительность в современных приложениях.

GeForce FX 5800 Ultra

Достоинства и недостатки новой архитектуры

Главное качество NVIDIA GeForce FX - повышенная гибкость и программируемость, перекрывающая базовые требования DirectX 9 и возможности ATI RADEON 9700 Pro, но гибкость архитектуры и программируемость обернулись для NVIDIA GeForce FX снижением производительности, причем, в некоторых аспектах - очень серьезным снижением.Самым слабым местом нового чипа стал недостаток вычислительной мощности арифметических процессоров, отвечающих за исполнение пиксельных шейдеров. Тяжелее всего GeForce FX давались пиксельные шейдеры DirectX9, использующие вычисления с плавающей точкой .Введение компрессии буфера кадра позволило поднять производительность при включении полноэкранного сглаживания, и в результате потери производительности на GeForce FX при включении полноэкранного сглаживания оказались намного ниже, чем у NVIDIA GeForce 4. Однако, в сравнении с ATI RADEON 9700 Pro новая видеокарта от NVIDIA смотрелась не всегда на высоте: здесь на производительность видеокарт влияла величина пропускной способности памяти, а GeForce FX 5800 Ultra, несмотря на гигантскую тактовую частоту микросхем памяти, имела вдвое более узкую шину и в результате - меньшую пропускную способность шины памяти.

Первая карта из серии FX - GeForce FX 5800 Ultra, которая поступила в продажу и являла собой некую архитектурную базу, на которой было затем основано целое семейство продуктов.Главный минус GeForce FX 5800 - это 128 битная шина обмена с памятью, ибо даже такая быстрая память, работающая на 500 (1000) МГц, не была способна обеспечить 500-мегагерцовому 8-конвейерному чипу требуемую ПСП. Этот минус самым трагичным образом сказался на АА, несмотря на наличие сжатия буфера кадра в MSAA режимах. ПСП 128 битной памяти никак не достаточно для записи 4000 закрашеных пикселей в секунду и NVIDIA пришлось ограничится 4 пиксельными процессорами и 2000 пикселями. В итоге, со скоростью в АА режиме дела у NV30 обстояли заметно хуже, чем у R300 (снабженного не только сжатием но и более широкой 256 бит шиной памяти).Еще один минус - шумный кулер, который, кроме того, был способен пугать пользователя того времени своими внезапными запусками или остановками (понижением частоты вращения). Из-за такой конструкции пользователь был вынужден жертвовать первым PCI-слотом.

nv30_gamma_sample1

Характеристики NVIDIA GeForce FX 5800 Ultra

Наименование GeForce FX 5800 Ultra
Ядро NV30
Техпроцесс (мкм) 0,13
Транзисторов (млн) 125
Частота работы ядра 500
Частота работы памяти (DDR) 500 (1000)
Шина и тип памяти DDR II - 128 bit
ПСП (Гб/с) 16
Пиксельных конвейеров 8 (4)
TMU на конвейер 1 (2)
Текстур за такт 8
Текстур за проход 16
Вершинных конвейеров 3
Pixel Shaders 2+
Vertex Shaders 2+
Fill Rate (Mpix/s) 4000
Fill Rate (Mtex/s) 4000
DirectX 9+
Anti-Aliasing (Max) SS & MS - 8x
Анизотропная фильтрация (Max) 8x
Объем памяти 128 MB
Интерфейс AGP 8x
RAMDAC 2x400 MHz

Массовыми и популярными видеокарты на базе NVIDIA GeForce FX 5800 Ultra,по сути так и не стали....

Need for Speed: Underground

Комментарии (0)

Оставьте свой комментарий

  1. Добавление комментария от гостя.
Вложения (0 / 3)
Share Your Location
Здесь ещё нет оставленных комментариев.

Последние комментарии

RadeoForce опубликовал комментарий в HITMAN 3 тест GPU/CPU
Я еще не запускал ее. В киберпуке 10% на статичном кадре, и 15%+ в динамике
RadeoForce опубликовал комментарий в HITMAN 3 тест GPU/CPU
Посмотрим
treex опубликовал комментарий в HITMAN 3 тест GPU/CPU
нет На этом мои полономочия все ) но из коробки у нее потолок 1500 оборотов Какой еще потолок 1500 на дешманской модели? ) 1800 оборотов при 73 градусах https://youtu....
RadeoForce опубликовал комментарий в HITMAN 3 тест GPU/CPU
treex Гейван гоняет в стоке, разве не видно? нет Так у этой карты 2100 оборотов предел но из коробки у нее потолок 1500 оборотов, только при приближении к критической тем...
treex опубликовал комментарий в HITMAN 3 тест GPU/CPU
Пора бы амд уже индусов убрать с релайва ) Сколько у тебя релайв сожрал в Хитмане 3 без упора в гпу?
RadeoForce опубликовал комментарий в HITMAN 3 тест GPU/CPU
ну если б он не релайвом писал видео, я бы еще мог что-то ответить. Но зная, сколько релайв откусывает фпс именно при упоре в проц(недогрузе гпу) - это минимум 10%, и ско...
RadeoForce опубликовал комментарий в HITMAN 3 тест GPU/CPU
покамест не знаю. Там несколько вариантов, будет выбран самый печальный ...
carsar1 опубликовал комментарий в HITMAN 3 тест GPU/CPU
так там 2 опции есть, где прям написано "жрущие до проца, нужно столько-то потоков". одна в настройках графики,другая в настройках звука. сначала бы выяснить, как именно ...
treex опубликовал комментарий в HITMAN 3 тест GPU/CPU
Какая локация, эта https://youtu.be/nehXcDp0eLs?t=47?

Конференция

    AVATAR
    RadeonForce опубликовал ответ к Death Stranding
    на земле меньше. В этой локации самое большое количество геометрии именно при просмотре с вышки
    1 час назад
    AVATAR
    treex опубликовал ответ к Death Stranding
    А на земле тоже самое? Может из-за того, что вверх улетел лоды порезались? Проц игра хорошо нагружает под 90% при 200 фпс.
    1 час назад
    AVATAR
    RadeonForce опубликовал ответ к Death Stranding
    treex Странно, что при всего 3000 ДК почти упор в проц при 120 фпс, я думал сложный ландшафт даст куда больше ДК. предполагаю, что это primitive shaders, или что-то наподобие, типа шейдера, написанног...
    1 час назад
    AVATAR
    treex опубликовал ответ к Death Stranding
    Странно, что при всего 3000 ДК почти упор в проц при 120 фпс, я думал сложный ландшафт даст куда больше ДК. Самый прикол в том, что он на движке Death Stranding сделан - но как же он далёк от DS как...
    2 часа назад
    AVATAR
    RadeonForce опубликовал ответ к Death Stranding
    UberDodge прикол как раз в том, что теперь логи из профайлера касательно видеопамяти выглядят ну просто очень похожими :-D Вот тут я попытался разобраться, что к чему. https://gamegpu.com/forum/viewt...
    10 часов назад
    AVATAR
    UberDodge опубликовал ответ к Death Stranding
    Кстати, на Хорайзон патч вышел, что-то они поправили связанное с видеопамятью радеонов, надо прогнать через профайлер. В чудеса не верю, тем более от жопоруков, но все же любопытно стало, что они там...
    19 часов назад
    AVATAR
    RadeonForce опубликовал ответ к Hitman 3
    .
    21 час назад
    AVATAR
    RadeonForce опубликовал ответ к Horizon Zero Dawn
    Кому нравятся эти попытки аналитики, заходите почаще на форум, особо интересные случаи буду публиковать здесь. :hi:
    21 час назад
    AVATAR
    RadeonForce опубликовал ответ к Horizon Zero Dawn
    Анализируем оптимизацию Horizon Zero Dawn после сегодняшнего обновления до версии 1.10 Итак, ребят, лед тронулся. К версии 1.10 в игре появились намеки на правильный менеджмент видеопамяти. Правда, т...
    21 час назад

Сейчас 297 гостей и 3 зарегистрированных пользователей на сайте

  • apan
  • row1
  • treex