GTX 580 положила начало эпохе AI

Генеральный директор Nvidia Дженсен Хуанг в подкасте Joe Rogan Experience рассказал, с чего началась революция в сфере глубокого обучения. Как оказалось, первая нейросеть, изменившая подход к компьютерному зрению, была обучена вовсе не на специализированном AI-оборудовании, а на двух видеокартах GTX 580 с 3 ГБ памяти в SLI, в 2012 году.

GTX 580 sli

Речь идёт о AlexNet, архитектуре, разработанной Алексом Крижевским, Ильёй Суцкевером и Джеффри Хинтоном в Университете Торонто. Тогда не существовало термина "глубокая нейросеть", а обработка изображений полагалась на ручные алгоритмы распознавания контуров и текстур. AlexNet объединила восемь слоёв и около 60 миллионов параметров, использовала сверточные и полносвязные слои, и впервые показала возможность самообучающейся модели, превзойдя существующие алгоритмы на 70% по точности.

Хуанг подчеркнул, что GTX 580 не имела функций для ИИ — она создавалась исключительно для игр и CUDA-программ. Но благодаря параллельной архитектуре GPU, именно такие карты оказались неожиданно подходящими для обучения нейросетей. AlexNet использовала обе карты, обмениваясь данными только при необходимости, что существенно ускоряло тренировку.

Этот прорыв стал переломным моментом для Nvidia. До этого компания не рассматривала ИИ как приоритет. После успеха AlexNet, Nvidia в 2012 году направила все ресурсы на развитие AI, что привело к созданию DGX-серверов, архитектуры Volta с Tensor-ядрами, а позже и DLSS. По словам Хуанга, без пары GTX 580, возможно, Nvidia так и осталась бы лишь графическим брендом.