Pliops представила ускоритель инференса XDP LightningAI — до 8 раз быстрее благодаря SSD вместо HBM

Автор Maximum Games, 16 Май 2025. Опубликовано в Железо

Компания Pliops анонсировала новое решение для ускорения инференса языковых моделей — PCIe-карту XDP LightningAI с программной платформой FusIOnX. Устройство создаёт промежуточный уровень памяти между GPU и SSD, позволяя хранить key-value данные вне HBM и мгновенно возвращать их при необходимости. Это устраняет повторные расчёты и снижает нагрузку на видеокарты, особенно в задачах с длинным контекстом.

XDP LightningAI

В обычных условиях данные, необходимые для поддержки контекста в LLM, хранятся в видеопамяти GPU. Когда объём превышает лимит HBM, старые записи удаляются, и при повторном использовании их нужно пересчитывать. Это приводит к потере производительности. Система от Pliops сохраняет эти данные на высокоскоростных SSD, подключённых через PCIe 5.0, и автоматически управляет их загрузкой в GPU-память.

Карты XDP LightningAI используют специализированный чип XDP ASIC и совместимы с фреймворками vLLM и Nvidia Dynamo. Решение не зависит от конкретного производителя видеокарт и может использоваться как в одиночных, так и в многосерверных конфигурациях. Также поддерживается совместное использование данных между задачами инференса и пользователями.

Компания утверждает, что производительность систем с XDP LightningAI увеличивается в 2.5–8 раз по сравнению с обычной конфигурацией, особенно при работе с длинными запросами. Это позволяет уменьшить требования к количеству видеокарт и снизить общую стоимость владения AI-инфраструктурой. В демонстрации использовалось до 24 SSD с совокупной пропускной способностью 336 ГБ/с.

Устройство уже доступно для интеграции в серверные решения, ориентированные на языковые модели и генеративный ИИ.

В начало страницы

Pliops представила ускоритель инференса XDP LightningAI — до 8 раз быстрее благодаря SSD вместо HBM

HARDWARE НОВОСТИ

ASUS официально выпустила золотые версии RTX 5090 и RTX 5080: цена доходит до $9 200

Nvidia раскритиковала экспортные ограничения США на чипы H20

Intel Core Ultra 7 254V засветился в бенчмарке

В Малайзии выявлен крупный склад поддельных жёстких дисков Seagate

Новый рекорд DDR5: частота памяти приблизилась к 12 900 MT/s

NVIDIA делает ставку на медь, откладывая внедрение кремниевой фотоники

AMD усиливает позиции в серверных процессорах и нацеливается на рынок AI

RTX 5090 D V2 показывает ту же производительность, что и RTX 5090 D, несмотря на урезанную память

Компания GPD представила GPD WIN 5

AMD готовит линейку Ryzen 9000XT: Zen 5 Refresh с повышенными частотами

SOFTWARE НОВОСТИ

Hero Games анонсировала CrisisX — постапокалиптическую игру с выживанием и масштабными войнами за ресурсы

ASUS официально выпустила золотые версии RTX 5090 и RTX 5080: цена доходит до $9 200

Nvidia раскритиковала экспортные ограничения США на чипы H20

Ветеран Ubisoft объяснил, почему Assassin’s Creed превратилась в RPG

Intel Core Ultra 7 254V засветился в бенчмарке

Аналитик предсказывает отмену проекта Fairgame$ после ухода Джейд Реймонд из Sony

В Малайзии выявлен крупный склад поддельных жёстких дисков Seagate

Новый рекорд DDR5: частота памяти приблизилась к 12 900 MT/s

Pearl Abyss представила новый 13-минутный геймплей демоверсии Crimson Desert

NVIDIA делает ставку на медь, откладывая внедрение кремниевой фотоники

Топ материалов GameGPU

The Elder Scrolls IV: Oblivion Remastered тест GPU/CPU...

The Last of Us Part II Remastered тест GPU/CPU...

Assassin’s Creed Shadows тест GPU/CPU...

DOOM: The Dark Ages тест GPU/CPU...

Clair Obscur: Expedition 33 тест GPU/CPU...

Grand Theft Auto V Enhanced Edition тест GPU/CPU...

Топ новостей GameGPU

NVIDIA Smooth Motion теперь доступна на RTX 40 через драйвер...

Battlefield 6: системные требования...

GeForce 60-й серии от NVIDIA обещает беспрецедентный скачок в производительности...

Huawei показала суперкластер CloudMatrix 384 с производительностью выше NVIDIA GB200...

VALORANT переходит на Unreal Engine 5 — обновление выйдет 29...

Battlefield 6 не будет работать на Linux и Steam Deck...