Intel представила первое обновление для Project Battlematrix с оптимизацией AI-нагрузок на Arc Pro B60
Intel выпустила первое крупное обновление программной части Project Battlematrix — инициативы, нацеленной на создание мощных AI-рабочих станций на базе фирменного оборудования. Новый инференс-оптимизированный софт улучшает оркестрацию AI-нагрузок на рабочих станциях с несколькими GPU серии Arc Pro B, включая до восьми видеокарт в одной системе и до 192 ГБ видеопамяти.
В составе обновления — Linux-базированный LLM Scaler для AI-инференса, который в версии 1.0 получил десять ключевых улучшений: от спекулятивного декодирования и torch.compile до онлайн-квантования по слоям для снижения требований к памяти. Оптимизации ускоряют обработку длинных входных данных TPOP до 1,8 раза для 32-миллиардных KPI-моделей и до 4,2 раза для 70-миллиардных, а также увеличивают пропускную способность вывода на 10% для моделей от 8 до 32 миллиардов параметров.
Основу рабочих станций составляет Arc Pro B60 — профессиональная версия Arc B580 с 20 Xe-ядрами, 24 ГБ GDDR6, 160 XMX-движками, поддержкой PCIe 5.0 и переменным TDP от 120 до 200 Вт. Система поставляется в контейнеризованной Linux-среде с готовыми модулями для развёртывания, включая мониторинг энергопотребления и пропускной способности памяти, обновление прошивки и диагностику GPU.
Релиз LLM Scaler 1.0 состоялся раньше намеченного срока — во втором квартале вместо третьего. До конца Q3 Intel планирует выпустить «усиленную» версию с расширенными возможностями, а полный набор функций, включая SRIOV, VDI и управление развертыванием ПО, ожидается в Q4. Таким образом, Project Battlematrix продолжает развиваться как комплексное решение для AI-рабочих станций с упором на масштабируемость и производительность.