DeepSeek отказалась от обучения модели R2 на чипах Huawei из-за технических ограничений
Китайская компания DeepSeek, ставшая одним из лидеров в области искусственного интеллекта, столкнулась с серьёзной технической неудачей. По информации Financial Times, проект по обучению новой флагманской модели R2 на чипах Huawei Ascend был полностью остановлен из-за нерешаемых проблем на ключевом этапе — тренировке модели. Эта ситуация стала ощутимым ударом по амбициям национальной программы технологической независимости Китая.
Несмотря на настойчивые рекомендации властей использовать отечественные аппаратные решения, инженеры DeepSeek выяснили, что чипы Huawei не выдерживают колоссальной нагрузки процесса обучения. Если для инференса (использования готовой модели) их мощности могут оказаться достаточными, то для ресурсоёмкой фазы тренировки производительности и стабильности оказалось недостаточно. Даже прибывшая на помощь команда специалистов Huawei не смогла устранить узкие места.
CEO Huawei Жэнфэй Жэнь ранее открыто признавал, что китайские аппаратные решения пока уступают передовым западным аналогам. Ситуация с DeepSeek стала наглядным подтверждением этих слов. В результате разработчики были вынуждены вернуться к проверенным системам Nvidia, обеспечивающим необходимую вычислительную мощь для завершения обучения R2.
Запланированный релиз модели в мае был сорван, а основатель DeepSeek Вэньфэнь Лян, по слухам, выразил недовольство текущими темпами и призвал команду сосредоточиться на создании действительно выдающегося продукта. Этот случай подчёркивает разрыв между стратегическими планами по импортозамещению и реальными инженерными возможностями в сфере высокопроизводительных вычислений.