Популярный фреймворк Ollama, предназначенный для локального запуска больших языковых моделей (LLM), вышел в новой тестовой версии 0.12.6-rc0. Главное нововведение — экспериментальная поддержка Vulkan API, которая давно находилась в разработке и теперь впервые стала доступна пользователям.
Ollama активно используется энтузиастами благодаря лёгкому запуску моделей Llama 3/4, Gemma, GPT-OSS, DeepSeek и других. Проект тесно интегрирован с Llama.cpp, обеспечивая высокую производительность и широкую поддержку библиотек и приложений. Однако до сих пор поддержка GPU была ограничена — для использования требовались ROCm, CUDA или SYCL. Благодаря внедрению Vulkan, запуск LLM теперь становится возможен на широком спектре GPU от AMD и Intel, для которых другие решения недоступны.
Поддержка Vulkan пока доступна только при сборке из исходного кода, и относится к числу экспериментальных функций. Разработчики подтверждают, что работают над устранением оставшихся ограничений и планируют добавить эту возможность в бинарные сборки Ollama в будущем.
Заявка на внедрение Vulkan велась уже полтора года, и сегодня она официально закрыта с выходом релиз-кандидата. Это важный шаг в сторону более широкой доступности Ollama на всех типах видеокарт, включая устаревшие и альтернативные GPU, где традиционные API недоступны.
Команда Valve, продолжающая активную работу над открытым графическим стеком Linux, выпустила обновления, которые улучшают поддержку видеокарт Radeon R9 290 серии Hawaii, выпущенных более 10 лет назад. Эти видеокарты давно сняты с поддержки производителем, но остаются актуальными для части Linux-геймеров.
Инженер Тимур Кристоф внёс исправления в драйверы RADV и RadeonSI, устраняющие зависания, возникавшие при использовании Hawaii GPU с Vulkan-драйвером RADV. Проблема особенно проявлялась в играх Dota 2 и Rise of the Tomb Raider, где зависания происходили через 20–30 минут после начала сессии или при просмотре повторов. В официальной документации AMD эта ошибка не описана, но найденный workaround устраняет сбои — пусть и с небольшими потерями производительности из-за снижения скорости обработки треугольников.
Дополнительно для старых видеокарт на архитектурах GFX6 и GFX7 отключены вычислительные очереди, поскольку в этих GPU был найден баг распределения регистров, вызывающий зависание при отправке команд. Всё это вошло в актуальную ветку Mesa 25.3-devel и уже помечено для бэка-порта в Mesa 25.2 stable, что обеспечит стабильность даже на старых системах.
NVIDIA резко наращивает масштаб серверных решений для ИИ — с 10 кВт у Ampere в 2020 году до более чем 1000 кВт у Rubin Ultra к 2028 году. Переход от Ampere к будущей платформе Kyber означает 100-кратный рост энергопотребления, что вызывает серьёзные вопросы о устойчивости такой экспансии.
Основной фактор роста — увеличение числа GPU на стойку. Если Hopper требовал около 40 кВт, то Blackwell уже поднимался до 120 кВт, а Blackwell Ultra — до 150 кВт. Следующее поколение, Rubin, заявлено на уровне 200–1000 кВт и выше, в зависимости от конфигурации. Кроме самих GPU, энергозатраты увеличивают NVLink/NVSwitch-фабрики, более плотные стойки и постоянная загруженность.
Согласно диаграмме Ray Wang, платформы Oberon и Kyber станут основой инфраструктуры ИИ в ближайшие годы, обслуживая гипермасштабируемые кампусы, построенные такими компаниями, как OpenAI и Meta. Уже сегодня в планах — добавление более 10 ГВт вычислительной мощности, что сравнимо с энергопотреблением средних стран.
Аналитики отмечают, что 1 ГВт мощности способен обеспечить электроэнергией 1 млн домохозяйств. Масштабы будущих дата-центров под ИИ уже вызывают беспокойство со стороны регулирующих органов. Исследование IEA прогнозирует, что к 2030 году ИИ удвоит потребление электроэнергии, опережая рост инфраструктуры в 4 раза.
Интегрированная графика нового поколения Intel Panther Lake показала впечатляющий результат в тесте 3DMark TimeSpy, набрав до 6300 баллов в графическом сегменте. Такой уровень уже позволяет обойти мобильную RTX 3050 6GB, хотя до RTX 4050 всё ещё сохраняется заметный отрыв.
Согласно данным, полученным на частоте 9600 MT/s, графика на архитектуре Xe3 с 12 блоками Xe достигает пикового результата в 6300 баллов, тогда как на 8533 MT/s результат составляет 6233 балла. Это подчёркивает сильную зависимость производительности от пропускной способности оперативной памяти.
Архитектурно, Panther Lake построен на гибридной технологии — CPU ядра (конфигурация 4P+8E+4LPE) используют процесс Intel 18A, а графический блок — TSMC N3E. В сравнении с предыдущим поколением Lunar Lake, где интегрированная графика набирала около 4000 баллов, новая версия показывает прирост более чем на 50%, что даже немного превышает официальные обещания Intel.
Графика 12Xe теперь уже внесена в обновлённую видеокарточную таблицу ноутбуков, где её позиционирование обозначено как Projection — ожидаемый уровень производительности в своём классе. Это первый интегрированный GPU от Intel, выходящий на уровень дискретных карт в среднем сегменте.
Apple официально подтвердила: MacBook Pro, iPad Pro и Apple Vision Pro с новым процессором M5 поступят в продажу 22 октября 2025 года. Доставка по предзаказам начнётся в тот же день, а устройства появятся в магазинах одновременно по всему миру.
Новый M5 стал пятым поколением Apple Silicon и построен на усовершенствованном 3-нм техпроцессе TSMC N3P. Базовая конфигурация включает 10-ядерный CPU и 10-ядерный GPU, что на два ядра больше, чем у M4. В каждом графическом ядре теперь встроен нейроускоритель, обеспечивающий многократный рост производительности в AI-задачах. По заявлениям компании, прирост составляет до 4 раз по сравнению с M4.
Помимо этого, чип получил третий уровень трассировки лучей, ускоренный Neural Engine, а пропускная способность памяти выросла с 120 до 153 ГБ/с. Также обещан рост производительности CPU на 15% и улучшение графики до 45%. Все эти улучшения направлены не только на ускорение работы в профессиональных задачах, но и на повышение качества игр и AI-обработки на устройствах Apple.
M5 уже доступен для предзаказа, однако версии M5 Pro, M5 Max и M4 Ultra пока не представлены — их анонс ожидается в течение следующих месяцев.
На фоне недавнего запуска NVIDIA Rubin, потребляющего до 2000 Вт на GPU и требующего жидкостного охлаждения, компания Positron AI представила противоположный подход: её чипы серии Atlas работают на воздушном охлаждении и потребляют менее 400 Вт, при этом обеспечивая в 2–5 раз выше эффективность по сравнению с конкурентами в задачах AI-инференса.
По словам CEO Mitesh Agarwal, почти 95% дата-центров в мире всё ещё используют воздушное охлаждение, и Positron намерена использовать это преимущество. Их архитектура обеспечивает не только более высокую утилизацию памяти (90% против 50% у NVIDIA), но и позволяет масштабироваться без дефицита HBM — поскольку используется собственная память, не зависящая от цепочки поставок NVIDIA и AMD.
Atlas уже сейчас показывает срок окупаемости около 15 месяцев, а следующий чип Asimov, с памятью до 2 ТБ, обещает вернуть вложения меньше чем за год. В интервью обсуждается не только борьба за рентабельность и токены, но и ограниченность мощности в существующих дата-центрах — например, Cloudflare, где Positron может стать альтернативой.
Ставка компании — AI-инференс, а не обучение, и в этой нише её эффективность особенно заметна. Даже если Rubin выигрывает в скорости на тренировках, Atlas и Asimov выигрывают в цене за токен, что важно для коммерческого использования.
Компания MSI официально заявила, что не поставляет видеокарты GeForce RTX 5090 в Китай, опровергнув слухи после появления фотографий сотен GPU с её логотипом, лежащих прямо на улице. Эти снимки вызвали волну обсуждений, так как RTX 5090 входит в список продуктов, запрещённых к экспорту в страну. MSI подчеркнула, что не имеет отношения к замеченным поставкам и провела проверку по серийным номерам.
Согласно заявлению, все карты, попавшие в Китай, являются параллельным импортом — легальными продуктами, ввезёнными в страну неофициально, без одобрения производителя. MSI подчеркнула, что такие видеокарты не имеют официальной гарантии, не обслуживаются в сервисных центрах и могли быть модифицированы или подделаны. Компания уточнила, что её RTX 5090 поставляются только в США, Европу и ряд стран Азиатско-Тихоокеанского региона.
Фон скандала — это продолжающиеся попытки обойти экспортные ограничения США. Ранее уже сообщалось о многомиллиардных партиях чипов NVIDIA, попавших в Китай через серый рынок. Несмотря на выпуск ослабленных версий RTX 5090D для местного рынка, многие покупатели предпочитают оригинальные модели. MSI и NVIDIA подчёркивают, что не участвуют в этих схемах, и любые «левые» видеокарты — на страх и риск покупателя.
Даже материнские платы на чипсетах серий 600 и 800 с BIOS объёмом 32 МБ получат поддержку процессоров AMD Zen 6. Об этом сообщил известный источник HXL, подчеркнув, что никакого удаления старых архитектур из прошивок не планируется — в отличие от ситуации с Zen 3 на AM4, где из-за 16 МБ BIOS приходилось жертвовать совместимостью.
Сейчас все основные производители, включая MSI, уже помечают платы для Ryzen 9000 как готовые к будущим CPU, и речь идёт именно о Zen 6. Прошивки с поддержкой новых чипов уже адаптированы как для 64 МБ, так и для 32 МБ версий, что делает платформу AM5 универсальной и долгоживущей. Это означает, что пользователи смогут обновиться на Zen 6 без замены платы — даже на бюджетных моделях.
Ранее возникали опасения, что объём BIOS в 32 МБ может стать ограничением, как это было в прошлом поколении. Однако в случае AM5 производители учли прошлый опыт: поддержка Zen 4, Zen 5 и Zen 6 останется в BIOS одновременно, без исключений. Это особенно важно на фоне выхода Ryzen 9000, когда многие рассматривают апгрейд в будущем.
Платформа AM5 подтверждает статус долгосрочного решения: теперь ясно, что даже младшие платы на 600-й и 800-й серии окажутся актуальными как минимум ещё на одно поколение процессоров.
Ключевые фразы: AM5 с 32 МБ BIOS, поддержка Zen 6, чипсеты 600 и 800 серии, обновления BIOS без удаления Zen 4, долгосрочная совместимость AMD
Несмотря на необычную форму, корпус вмещает полноценную видеокарту и стандартные компоненты: Intel Core i7-4850K, 32 ГБ RAM и GeForce GTX 1080. Внутри скрыта и система водяного охлаждения, так как вентиляция у конструкции ограничена. Автор отметил, что "в пирамидах ПК работают быстрее" — по его словам, прирост в играх составил до 10 FPS, пусть и без объяснений причин.
Корпус быстро стал вирусным: пользователи сравнивают его с обелиском из Command & Conquer и предлагают встроить лазер на верхушке. Несмотря на юмористический подход, это — полностью рабочая сборка, которая не только впечатляет внешне, но и стабильно функционирует даже в VR с HTC Vive. Такой кейс сложно купить, но легко мечтать.
OpenAI сотрудничает с Arm (принадлежит SoftBank) над созданием нового серверного CPU, который дополнит разрабатываемый совместно с Broadcom AI-ускоритель. Проект призван расширить контроль OpenAI над своей инфраструктурой и снизить зависимость от сторонних решений — в первую очередь, от GPU от Nvidia.
Новый серверный процессор от Arm станет частью следующего поколения AI-стоек OpenAI и будет использоваться как вместе с собственным ускорителем на базе Broadcom, так и с системами на основе GPU от AMD и Nvidia. Это один из крупнейших шагов Arm в сторону дата-центров: компания не просто предоставляет архитектуру, но и занимается непосредственной разработкой и производством CPU.
OpenAI ранее анонсировала собственный ускоритель, создаваемый с Broadcom. Чип заточен под инференс-нагрузки и должен масштабироваться до 10 ГВт вычислительной мощности в период с 2026 по 2029 годы. По оценкам аналитиков, полное развертывание новых стоек с участием OpenAI, AMD и Nvidia может обойтись более чем в $1 трлн, а выручка Arm от участия в проекте может достичь миллиардов — критически важно для SoftBank, вложившегося в оба направления.
Если Broadcom и TSMC смогут наладить масштабное производство, OpenAI получит дополнительный рычаг давления на Nvidia и снизит риски дефицита GPU, которые сдерживали развитие AI-сектора весь последний год.