NVIDIA и OpenAI выпустили gpt-oss — открытые ИИ-модели для ПК с RTX, до 250 токенов/с на RTX 5090

Автор Maximum Games, 06 Август 2025. Опубликовано в Железо

NVIDIA совместно с OpenAI представила семейство открытых ИИ-моделей gpt-oss, доступных для запуска прямо на потребительских ПК с видеокартами GeForce RTX. Это серьёзный шаг к демократизации ИИ: модели, ранее доступные только в облаке, теперь работают локально на устройствах с RTX GPU, обеспечивая высокую скорость и поддержку современных функций.

Модель gpt-oss-20b рассчитана на ПК с RTX и минимум 16 ГБ видеопамяти, демонстрируя до 250 токенов в секунду на флагманской GeForce RTX 5090. Более крупная модель gpt-oss-120b ориентирована на профессиональные рабочие станции с видеокартами серии RTX PRO. Обе модели поддерживают длину контекста до 131 072 токенов, что делает их одними из самых продвинутых решений для локального ИИ.

Модели обучены на GPU NVIDIA H100 и впервые используют формат MXFP4, обеспечивающий высокую точность без дополнительных затрат производительности. Архитектура MoE (Mixture of Experts) позволяет эффективно выполнять цепочки рассуждений, следовать инструкциям и использовать внешние инструменты — всё это работает локально без подключения к облаку.

NVIDIA продвигает использование этих моделей с помощью приложений вроде Ollama, а также поддерживает репозиторий Llama.cpp, адаптированный под RTX с использованием CUDA Graphs. Разработчики Windows могут запускать модели через Microsoft AI Foundry Local, воспользовавшись простой командой в терминале.

В начало страницы

NVIDIA и OpenAI выпустили gpt-oss — открытые ИИ-модели для ПК с RTX, до 250 токенов/с на RTX 5090

HARDWARE НОВОСТИ

Первые бенчмарки Radeon AI PRO R9700: быстрее RTX 6000 Ada, дешевле вдвое и холоднее

Radeon AI PRO R9700 выходит в розницу: 32 ГБ памяти, 300 Вт и цена $1299

AMD поставит суперкомпьютеры Lux и Discovery для Минэнерго США на базе новых AI-чипов MI355X и MI430

GeForce RTX 5050 ITX от MSI: компактная видеокарта на архитектуре Blackwell

Qualcomm представила AI200 и AI250 — новое поколение дата-центровых решений для генеративного ИИ

AMD представила линейки Ryzen 10 и Ryzen 100 — переименованные процессоры на Zen 2 и Zen 3+

MacBook Pro M5 показывает более чем трёхкратный рост скорости SSD по сравнению с M4

Zephyrus M16 с RTX 4090 после шунт-мода догнал 5090-ноутбуки по производительности

Lenovo Legion Go получит поддержку «Extreme Mode» в Linux

Дефицит LPDDR5X: поставки смартфонной памяти смещаются на середину 2026 года

SOFTWARE НОВОСТИ

Первые бенчмарки Radeon AI PRO R9700: быстрее RTX 6000 Ada, дешевле вдвое и холоднее

Отменённая мультиплеерная God of War от Bluepoint возвращала Кратоса в Древнюю Грецию

Assassin’s Creed Shadows — патч 1.1.4 с «Искажёнными замками», новым паркуром и золотым оружием

Упрощённый Lumen может ускорить Unreal Engine 5

Serious Sam 2 получил артбук и поддержку редактора Edit Data

Ghost of Tsushima: Steam Deck Verified и поддержка FSR 4

Radeon AI PRO R9700 выходит в розницу: 32 ГБ памяти, 300 Вт и цена $1299

AMD поставит суперкомпьютеры Lux и Discovery для Минэнерго США на базе новых AI-чипов MI355X и MI430

GeForce RTX 5050 ITX от MSI: компактная видеокарта на архитектуре Blackwell

Новая Xbox объединит PC и консоль в одной системе с полным доступом к Steam

Топ материалов GameGPU

Borderlands 4 тест GPU/CPU...

DOOM: The Dark Ages тест GPU/CPU...

Battlefield 6 Open Beta тест GPU/CPU...

Обзор и тестирование видеокарты Asus PRIME GeForce RTX 5070 12GB...

Подпишитесь на наш Telegram-канал GameGPU!

Mafia: The Old Country тест GPU/CPU...

Топ новостей GameGPU

Battlefield 6: невероятные показатели FPS с DLSS 4 на видеокартах...

STALKER 2 получит патч 1.7 до перехода на Unreal Engine...

AMD выпустила драйвер Adrenalin 25.10.1 с поддержкой Battlefield 6...

AMD расширяет линейку Ryzen 9000 X3D: новые 9950X3D2 и 9850X3D...

Battlefield 6 требует постоянного подключения к интернету — даже для...

$55 млрд за Electronic Arts и взлёт Steam: итоги третьего...