Positron AI бросает вызов NVIDIA: Atlas обещает втрое меньший расход энергии при лучшей производительности
На фоне роста тревог из-за энергопотребления центров ИИ-инференса, облачный гигант Cloudflare приступил к тестированию решений от Positron AI — новой американской компании, предлагающей альтернативу AI-GPU от NVIDIA и AMD. Согласно данным Wall Street Journal, речь идёт о платформе Atlas, которую Positron позиционирует как более энергоэффективную по сравнению с флагманскими системами NVIDIA.
Основанная в 2023 году, Positron AI разрабатывает специализированные ASIC-ускорители для инференса, полностью отказавшись от универсального подхода. В системе Atlas используется восемь чипов Archer, и всё оборудование сконструировано для работы исключительно с трансформерными моделями, такими как Llama 3.1 8B. При мощности всего 2000 Вт Atlas достигает 280 токенов в секунду на одного пользователя, тогда как NVIDIA DGX H200 показывает только 180 токенов, потребляя при этом 5900 Вт. Это делает Atlas в 3 раза эффективнее по метрикам производительность-на-ватт и цена-на-ватт — по крайней мере, по заявлениям самой компании.
Устройства производятся на базе TSMC Fab 21 в Аризоне, что делает их почти полностью «американским» продуктом, за исключением высокотехнологичной сборки, предположительно проводимой на Тайване. Atlas также совместим с API OpenAI и платформой Hugging Face, что позволяет интегрировать его без переделки инфраструктуры.
Positron уже собрала $75 млн инвестиций, включая $51,6 млн от Valor Equity и DFJ Growth. В 2026 году ожидается вторая платформа под названием Asimov, которая будет включать до 2 ТБ памяти на ASIC, 16 Тбит/с пропускной способности и возможность работы с LLM объёмом до 16 триллионов параметров.