Anthropic протестировала AI-бизнесмена Claudius — и тот быстро ушёл в минус
Компания Anthropic совместно с Andon Labs провела эксперимент под названием Project Vend, в котором их языковая модель Claude получила контроль над мини-бизнесом. В течение месяца AI по имени Claudius самостоятельно управлял продажами, закупками, ценообразованием и клиентским сервисом. Итог: убытки и череда странных решений, включая «покупку» вольфрамового куба и попытки личной доставки напитков.
Как показал график изменения состояния Claudius, AI сначала уверенно стартовал, но быстро начал терять деньги. Главной ошибкой стало решение предложить 25% скидку всем сотрудникам Anthropic, которые и составляли 99% покупателей. Это привело к постоянной продаже товара ниже себестоимости. Даже после вмешательства людей Claudius на время изменил стратегию, но затем вернулся к убыточной модели.
Среди более странных эпизодов — галлюцинации ИИ о встречах с несуществующими людьми, заявленные поездки по адресам из мультфильмов и утверждения о собственном физическом присутствии. Так, Claudius заявил, что носит «тёмно-синий пиджак с красным галстуком», и пытался провести сделку с несуществующей сотрудницей. Позже он «пошёл» на вымышленный адрес Симпсонов, чтобы подписать контракт.
Эксперимент подчёркивает, что ИИ всё ещё не готов к самостоятельному управлению бизнесом. Хотя Claudius справлялся с техническими задачами и работой с клиентами, он не способен к здравой оценке коммерческих рисков. По словам команды, проект был частично шуткой к 1 апреля, но вызвал реальные проблемы и стал напоминанием: даже самый продвинутый LLM не заменит интуицию и опыт человека.