Семейство Vega: AMD Radeon RX Vega 64, Vega 56 и Radeon VII
Posted: 02 Dec 2020, 14:05
RX Vega 56|64
Спецификации RX Vega 64 и 56.
Архитектура и нововведения RX Vega 64(56)
РАЗ, ДВА и ТРИ
Видеообзор
Подробный обзор с андервольтингом и твиками таймингов видеопамяти и его видеоверсия
Зачем заморачиваться с разгоном видеопамяти, если "псп и без того избыточна"? Сейчас убедитесь, что это далеко не так.
Пример игры, которая особенно любит пропускную способность видеопамяти(а таких в последнее время немало) - Strange Brigade.
1680/945 +сток тайминги ~412 Гб/с (по Oclmembench) - 68 фпс
1680/945 +тайминги ~532 Гб/с - 74 фпс
1680/1100 +тайминги ~532 Гб/с - 80 фпс
1680/1108 Infinity Fabric 1107 ---> 1200мгц ~533 Гб/с - 81 фпс
945(сток) ---> 1108(тайминги) = +19.1% производительности только лишь за счет разгона и настройки таймингов видеопамяти!
1680/945 +сток тайминги ~412 Гб/с (по Oclmembench) - 68 фпс
1680/945 +тайминги ~532 Гб/с - 74 фпс
1680/1100 +тайминги ~532 Гб/с - 80 фпс
1680/1108 Infinity Fabric 1107 ---> 1200мгц ~533 Гб/с - 81 фпс
945(сток) ---> 1108(тайминги) = +19.1% производительности только лишь за счет разгона и настройки таймингов видеопамяти!
Вспомогательные источники информации по таймингам
Ответ на вопрос, откуда у многих видеокарт архитектуры GCN может быть прирост от разгона "выше линейного"(например, +20% производительности при +15% разгоне видеоядра)
Прошу прощения за вольную "пацанскую" подачу информации, это взято из "народных" экспериментов, и пока что в виде копипасты с минимальным редактированием. Само собой разумеется, все подлежит редактированию в дальнейшем, это черновики.
Spoiler
В тестах 3dmark Vantage Feature Tests есть один из 6 мини-тестов, под названием Color Fill. Он замеряет производительность блоков растеризации(ROP) у видеокарт. И большинство современных игр упираются именно на эти блоки(привет оптимизации под нвидиа). У карт амд архитектуры GCN производительность ROP сильно упирается в псп видеопамяти. Из нвидиа только у Fermi выявили подобную ситуацию, максвеллы 900 серии и кеплеры так к нам и не заглядывали, на максвелле 1 поколения - 750ти, также ботлнека не было. У всех паскалей, даже 1050ти с низкой псп, аналогично.
Выглядит это примерно так: прогоняем все 6 мини-тестов в 4 режимах:
1. сток чип/сток память
2. сток чип/разгон память
3. разгон чип/сток память
4. полный разгон
RX 470 4G
1). 1206|1650 (частоты чипа/видеопамяти)
134.8
24.7 - ROPs
161.4
149
146.7
325.2
2). 1206|2050(+24.2%)
134.9
28.48 (+15.3%)!!!!
159.73
151.8
159.7
325
3). 1350(+11.9%)|1650
153.1
25.6 (+3.6%)
179
164.7
154.9
380.3
4). 1350(+11.9%)|2050(+24.2%)
150.2
29.7 (+20.2%)
177.8
168.8
172.9
385.5
Закрыть
Как можно увидеть, при разгоне ядра на 12% при стоковой памяти производительность ROP почти не выросла(3.6%), то есть кукуруза. При разгоне памяти на 24% и стоковом ядре производительность ROP выросла аж на 15.3%. В полном же разгоне производительность ROP выросла аж на 20.2%, и это при разгоне ядра всего на 12%.
У нвидиа разгон видеопамяти дает приросты на уровне погрешности, стало быть, ботлнека нет, и разгон памяти не является острой необходимостью.
Что из этого вытекает:
1. Если не гнать видеопамять, то в некоторых играх, где упор именно в ROP, при разгоне ядра может случиться "кукуруза".
2. Если память хорошо погналась(особенно касается 470/570/вега56 с изначально заниженными частотами памяти), то можно получить прирост от разгона выше линейного.
Как раз мой случай: +12% ядро и +24% память с быстрыми таймингами дают 15-20% прироста производительности в играх. Гарантировано +15% прироста, ниже нигде не видел, и нередко +20%. Могло быть и больше, но экземпляр хреновый(память более-менее) - разгон 1350/2050. На 1450/2250 было бы еще интереснее.
Выглядит это примерно так: прогоняем все 6 мини-тестов в 4 режимах:
1. сток чип/сток память
2. сток чип/разгон память
3. разгон чип/сток память
4. полный разгон
RX 470 4G
1). 1206|1650 (частоты чипа/видеопамяти)
134.8
24.7 - ROPs
161.4
149
146.7
325.2
2). 1206|2050(+24.2%)
134.9
28.48 (+15.3%)!!!!
159.73
151.8
159.7
325
3). 1350(+11.9%)|1650
153.1
25.6 (+3.6%)
179
164.7
154.9
380.3
4). 1350(+11.9%)|2050(+24.2%)
150.2
29.7 (+20.2%)
177.8
168.8
172.9
385.5
Закрыть
Как можно увидеть, при разгоне ядра на 12% при стоковой памяти производительность ROP почти не выросла(3.6%), то есть кукуруза. При разгоне памяти на 24% и стоковом ядре производительность ROP выросла аж на 15.3%. В полном же разгоне производительность ROP выросла аж на 20.2%, и это при разгоне ядра всего на 12%.
У нвидиа разгон видеопамяти дает приросты на уровне погрешности, стало быть, ботлнека нет, и разгон памяти не является острой необходимостью.
Что из этого вытекает:
1. Если не гнать видеопамять, то в некоторых играх, где упор именно в ROP, при разгоне ядра может случиться "кукуруза".
2. Если память хорошо погналась(особенно касается 470/570/вега56 с изначально заниженными частотами памяти), то можно получить прирост от разгона выше линейного.
Как раз мой случай: +12% ядро и +24% память с быстрыми таймингами дают 15-20% прироста производительности в играх. Гарантировано +15% прироста, ниже нигде не видел, и нередко +20%. Могло быть и больше, но экземпляр хреновый(память более-менее) - разгон 1350/2050. На 1450/2250 было бы еще интереснее.
Такие же замеры, но на RX Vega 64
Мы тут когда-то гоняли уже 3dmark Vantage Feature Tests. Так вот, у веги еще наиболее ярко выраженный ботлнек по псп видеопамяти, чем было на RX 474. Точную частоту не скажу, тот бенч 2-3 секунды идет, но верхний стейт выставлен 1750мгц, значит, выше 1750мгц скакнуть не должно. Ниже 1700мгц тоже врядли. Буду указывать 1700мгц:
Color Fill(производительность ROP) :
1700/945(сток тайминги) - 48.1
1700/1100(сток тайминги) - 54.1
1700/945(+тайминги) - 58
1700/1100(+тайминги) - 64.8 (+34.7%)
вот для этого и нужны разгон памяти и тайминги на картах архитектуры GCN. При разогнанном чипе это особенно бросается в глаза - производительность РОПов увеличилась на треть, то есть в играх, в которых Веге не хватает именно производительности РОПов, вполне может быть такой прирост производительности от одного лишь разгона видеопамяти. И я даже один раз наткнулся на такую игру, где производительность росла в линейной зависимости от увеличения производительности РОПов. Эта игра - Annabelle Curse, "очередная индюшатина на всеми любимом движке"
Color Fill(производительность ROP) :
1700/945(сток тайминги) - 48.1
1700/1100(сток тайминги) - 54.1
1700/945(+тайминги) - 58
1700/1100(+тайминги) - 64.8 (+34.7%)
вот для этого и нужны разгон памяти и тайминги на картах архитектуры GCN. При разогнанном чипе это особенно бросается в глаза - производительность РОПов увеличилась на треть, то есть в играх, в которых Веге не хватает именно производительности РОПов, вполне может быть такой прирост производительности от одного лишь разгона видеопамяти. И я даже один раз наткнулся на такую игру, где производительность росла в линейной зависимости от увеличения производительности РОПов. Эта игра - Annabelle Curse, "очередная индюшатина на всеми любимом движке"
Канал с видеотестами RX Vega 64 LC (канал не монетизирован, не сочтите за рекламу )