ROCm 7.1 вышел с поддержкой MI350X, улучшениями HIP и расширением совместимости
AMD выпустила обновлённую версию открытого стека GPU-вычислений ROCm 7.1, менее чем через два месяца после релиза ROCm 7.0. Новый выпуск приносит глубокую оптимизацию под ускорители Instinct MI350X и MI355X, а также расширяет совместимость с дистрибутивами Linux и интерфейсами NVIDIA CUDA.

Среди главных нововведений — официальная поддержка Instinct MI350X и MI355X в Debian 13 с использованием драйвера AMDGPU DKMS. Также Instinct MI325X теперь поддерживается в RHEL 10, SLES 15 SP7, Debian 12/13, Oracle Linux 9 и 10. Интересно, что даже устаревший MI100 теперь официально поддерживается в SUSE Linux Enterprise Server 15 SP7.
Для виртуализации реализована поддержка ROCm 7.1 в гостевых системах RHEL 10 с использованием KVM SR-IOV. Добавлена возможность установки ограничения по питанию (power cap) в 1VF на Instinct MI300X через AMD SMI. Проведены доработки в механизмах виртуализации для MI350-серии.
На стороне программной совместимости AMD усиливает позиции HIP — библиотека получила новые runtime API, поддержку вложенного разбиения на плитки в кооперативных группах, а также снижена задержка при загрузке модулей. Это всё приближает HIP к функциональности CUDA от NVIDIA.
Производительность улучшена в hipBLASLt (новые оптимизации ядра для MI350), hipSPARSELt и RCCL (повышена эффективность внутри одного узла). Профилировщик ROCm также получил обновления.
Кроме того, ROCm 7.1 включает поддержку TensorFlow 2.20 и ONNX Runtime 1.23.1, что делает его более привлекательным для задач машинного обучения и ИИ в дата-центрах.
















