TensorWave запускает кластер на 8192 GPU AMD — крупнейшая ИИ-система на MI325X в Северной Америке
Компания TensorWave, занимающаяся инфраструктурой для ИИ, официально представила кластер из 8192 графических ускорителей AMD Instinct MI325X, что делает его крупнейшим AMD-базированным ИИ-инсталляцией в Северной Америке. Проект также стал первым в своём роде с полной прямой жидкостной системой охлаждения, о чём компания сообщила в X, сопроводив новость фото стоек с ярко-оранжевыми шлангами системы охлаждения.
Каждый ускоритель MI325X оснащён 256 ГБ памяти HBM3e с пропускной способностью 6 ТБ/с, а благодаря архитектуре с 19 456 потоковыми процессорами, чип развивает до 2,6 PFLOPS FP8. Несмотря на выход более новых MI350X и MI355X, MI325X остаётся крайне производительным решением и прямым конкурентом NVIDIA H200, особенно с учётом более доступной цены.
Однако, у MI325X есть ограничение — поддержка до 8 GPU на узел, в отличие от NVIDIA с её масштабируемыми 72-GPU системами. TensorWave пошла другим путём, делая ставку не на масштаб внутри узлов, а на плотность размещения и тепловой резерв, реализовав собственную прямую жидкостную систему охлаждения, где холодные пластины напрямую охлаждают каждый чип.
Потребление энергии одного MI325X достигает 1000 Вт, что требует серьёзных инженерных решений, и TensorWave успешно обошлась без 16-контактных разъёмов питания. В сумме кластер обеспечивает более 2 петабайт/с совокупной пропускной способности памяти и примерно 21 эксафлопс FP8-вычислений, хотя эффективность зависит от параллелизма моделей и связности между GPU.
TensorWave предоставляет облачную инфраструктуру для ИИ как услугу, так что ответственность за масштабирование ИИ-моделей ложится на пользователей. Этот проект следует за привлечением $100 млн инвестиций в рамках раунда Series A, в который вложились AMD Ventures и Magnetar Capital. В отличие от большинства облачных провайдеров, TensorWave делает ставку на AMD, заявляя, что стек ROCm наконец готов к обучению полноценных моделей.
И это только начало. Во второй фазе проекта компания планирует интеграцию MI350X, основанных на архитектуре CDNA 4 и поддерживающих FP4/FP6, ещё большей пропускной способностью и TDP до 1400 Вт — уровень, который невозможно охладить воздушным способом. Таким образом, выбор в пользу жидкостного охлаждения был стратегически оправдан.