AMD представила ROCm 7: ускорение ИИ-инференса до 3.8× и полная поддержка MI350

Автор Maximum Games, 12 Июнь 2025. Опубликовано в Железо

AMD официально анонсировала следующее поколение открытого ПО — ROCm 7, сосредоточенное на ускорении ИИ-инференса и поддержке серии Instinct MI350. Новый стек технологий приходит на смену ROCm 6 и включает поддержку форматов FP8, FP6 и FP4, а также оптимизации для распределённой обработки и префиллинга.

В ROCm 7 реализованы новые алгоритмы и ядра, включая GEMM Autotuning, MoE, Attention и Python-кернелы, а также добавлены фреймворки vLLM v1, llm-d и SGLang. Основной прирост производительности зафиксирован в задачах инференса: до 3.5× быстрее, чем ROCm 6, с максимумом 3.8× в DeepSeek R1, 3.2× в Llama 3.1 70B и 3.4× в Qwen2-72B.

ROCm 7 на MI355X опережает Blackwell B200 с CUDA на 30% по пропускной способности в DeepSeek R1 (FP8). Кроме того, ускорение обучения до 3× получено в Llama 2, 3.1 и Qwen 1.5. Новый стек также масштабируется на CPU, GPU и DPU, обеспечивая универсальные решения для Enterprise AI и GenAI-задач.

В начало страницы

AMD представила ROCm 7: ускорение ИИ-инференса до 3.8× и полная поддержка MI350

HARDWARE НОВОСТИ

Пользователи Windows 10 LTSC 2021 жалуются на ложные сообщения об окончании поддержки

Китайцы тестируют редкий прототип видеокарты GeForce GTX 1660 с поддержкой PCIe 4.0

Майкл Бьюрри сделал крупную ставку против Nvidia и Palantir из-за страха перед «пузырём ИИ»

NVIDIA выпустила драйвер Game Ready 581.80: драйвер с поддержкой Call of Duty: Black Ops 7

Zen 5 ломает графику: инструкция RDSEED не работает корректно на новых процессорах AMD

Китайцы показали материнскую плату с 22 USB — без видеокарты, но с LGA1700

Цены на DRAM взлетели на 171,8% за год

Чипы NVIDIA Blackwell производятся в США — благодаря участию TSMC, Foxconn и других тайваньских партнёров

Установлен мировой рекорд частоты DDR5: 13153.6 МГц

Snapdragon 8 Elite Gen 6 разделится на Standard и Pro: новые слухи о флагмане 2026 года

SOFTWARE НОВОСТИ