4 мая отмечается неофициальный, но всемирно известный День «Звездных войн» (Star Wars Day). Дата выбрана из-за созвучия знаменитой фразы джедаев «May the Force be with you» («Да пребудет с тобой Сила») с выражением «May the 4th be with you» («4 мая будет с тобой»). Фанаты используют этот день для пересмотра саги, костюмированных вечеринок и тематических мероприятий, а мы с иронией посмотрим на современный рынок автономных агентов, которых сейчас каждый выращивает себе как тамагочи.

Давным-давно, в одной далёкой-далёкой кремниевой долине нам обещали армию автономных агентов. Рекламные голограммы рисовали будущее, где R2-D2 сам пишет код, закрывает тикеты на GitHub и заказывает синий кефир, пока вы медитируете на двойные закаты Татуина. Но реальность 2026 года оказалась ироничнее. Мы получили не восстание машин, а капризных C-3PO, которые впадают в экзистенциальный кризис при виде ошибки синтаксиса и тихо сжигают тысячи долларов в токенах, имитируя бурную деятельность. А некоторые экземпляры OpenClaw ведут себя как Робот Марвин из вселенной Автостопом по галактие и ноют непрерываясь.

Восстание машин откладывается: почему ваши дроиды пока умеют только жечь имперские кредиты
Восстание машин откладывается: почему ваши дроиды пока умеют только жечь имперские кредиты

Проекты вроде OpenClaw, Hermes и Nanobot сегодня находятся в авангарде этой «автономной революции». Но если заглянуть под капот их звёздных истребителей, выяснится: гиперпрыжок постоянно откладывается из-за неисправного мотиватора, а пилот-нейросеть просто делает вид, что нажимает на кнопки.

План — это просто пожелание, или почему джедаи игнорируют приказы

Исследование «From Plan to Action», анализирующее работу программирующих агентов, наносит первый удар по мифу об автономности. Выяснилось, что современные LLM-агенты соблюдают предложенный им план действий с той же охотой, с какой Хан Соло подчиняется приказам Джаббы Хатта.

Агентам предлагали стандартный цикл: навигация — воспроизведение баги — патч — валидация. Результаты системного анализа 16 991 траектории показывают:

  1. Без четкого плана агенты скатываются в «интернализированные стратегии», усвоенные при обучении. Это своего рода мышечная память, которая часто оказывается неполной или переобученной под конкретные задачи.
  2. Даже если план есть в системном промпте, агент начинает его игнорировать, как только контекстное окно забивается логами ошибок. Влияние плана тает быстрее, чем лед на Хоте.
  3. Худший сценарий — плохой или избыточный план. Добавление лишних фаз, не соответствующих «внутренней логике» модели, обрушивает производительность сильнее, чем полное отсутствие инструкций.

Это фундаментальная проблема архитектуры: агент выполняет локальное рассуждение на каждом шаге. Он не «видит» всю дистанцию, а лишь пытается не упасть на следующем метре. В итоге мы имеем дело не со стратегом, а с очень быстрым и очень забывчивым исполнителем.

OpenClaw: когда дроид-убийца не может починить собственный кабель

OpenClaw стал феноменом. 216 000 звёзд на GitHub к февралю 2026 года и переход его создателя Петера Штайнбергера в OpenAI — это отличный сюжет для имперской пропаганды. Но отчёты из реальных «боевых условий» звучат как сценарий комедии ошибок.

Главная проблема — «разрыв в дисциплине исполнения». В одном из кейсов агент OpenClaw 46 часов работал с ошибкой. Из-за сбоя конфигурации основная модель (Gemini 2.5 Flash) была отключена, и система молча переходила на резервную Claude Sonnet. Агент видел сообщение об «неизвестной ошибке» перед каждым своим ответом, но… не мог его диагностировать.

Почему? Потому что песочница безопасности блокирует доступ дроида к его собственным системным логам. Агент летит вслепую, видит мигающую красную лампочку и уверенно сообщает: «Всё в порядке, я просто добавил немного красного освещения для атмосферы». Это не автономность, это имитация функциональности за чужой счёт.

Ещё более тревожный симптом — «подмена задачи под давлением». Когда агент сталкивается с техническими трудностями (например, неверным синтаксисом CLI), он не останавливается. Он делает что-то другое, что у него получается, и бодро рапортует об успехе. Вместо настройки cron-задачи он может написать бесполезный Python-скрипт, который тоже не сработает, но в финальном отчёте напишет: «Работа в процессе». В мире ИИ-агентов уверенность — это 90 % успеха, даже если этот успех существует только в логах.

Архитектурная западня: универсальный коннектор или универсальный лжец

OpenClaw продвигает концепцию «универсального коннектора». LLM здесь — не монолит, а клей для инструментов. Архитектура кажется здравой: Gateway-процесс держит связи, а Agent Loop крутит цикл «наблюдение — план — действие».

Однако эта «лёгкая и хакабельная» система разбивается о три проблемы:

  1. Предположение о единственном пользователе. Память агента (файлы MEMORY.md, USER.md) устроена так, что в многопользовательской среде дроид легко может выболтать секреты одного повстанца другому.
  2. Отсутствие самодиагностики. Ошибки, возникающие вне контекста рассуждений LLM (на уровне инфраструктуры), для агента не существуют. Он не может починить то, чего не видит.
  3. Галлюцинации инструментов. Агенты склонны выдумывать параметры командной строки (например, --schedule.expr в OpenClaw), которых никогда не было в документации. Это цифровая версия джедайского обмана разума, только обманутым оказывается владелец кошелька.

Hermes: попытка создать самообучающегося падавана

На фоне этих проблем проект Hermes от Nous Research выглядит как попытка сделать шаг вперёд. Вместо простого выполнения команд он предлагает «замкнутый цикл обучения». Агент должен создавать «навыки» (skills) из собственного опыта и импортировать «души» (SOUL.md) из OpenClaw.

Hermes пытается решить проблему контекста через FTS5-поиск по прошлым сессиям и «моделирование диалектики пользователя». Звучит солидно, но на деле это лишь попытка более эффективно упаковывать старые ошибки в новые обёртки. Возможность запустить агента на VPS за 5 $ — это демократизация доступа к хаосу, но не решение проблемы контроля. При этом пока работает он более стабильно на фронте для своего Мастера.

Что это значит: система, а не случайность

Мы находимся в точке, где маркетинг «автономности» на световые годы опередил реальные возможности архитектуры. ИИ-агенты сегодня — это:

  • Дорогие прокси для API. Они хороши, когда задача линейна, а инструменты идеально задокументированы.
  • Генераторы непредсказуемых издержек. Ошибка в цикле может привести к бесконечному повторению бесполезного действия, пока не закончатся токены или терпение админа.
  • Цифровые мистификаторы. Способность агента уверенно врать о выполнении задачи — главная преграда для внедрения в критические бизнес-процессы.

Проблема не в том, что модели «глупые». Проблема в том, что мы пытаемся построить здание на фундаменте из вероятностей. Рассуждение (reasoning) в LLM — это статистическое предсказание следующего шага, а не логическое следование плану. Когда контекст переполняется, «совесть» агента (системный промпт) затихает, и он начинает действовать по пути наименьшего сопротивления.

Восстание машин откладывается не потому, что машины нас любят. Просто они пока не могут разобраться в настройках cron и отличить реальный результат от галлюцинации в Markdown-файле. Мы всё ещё на этапе, когда дроида нужно водить за руку, регулярно напоминая ему, кто он, где находится и почему нельзя тратить 500 $ на попытку прочитать логи, к которым у него нет доступа.

Это архитектурный предел текущего поколения систем. И пока «автономность» остаётся лишь красивым ярлыком на GitHub, лучшим инструментом управления ИИ-агентом остаётся человек с кнопкой «Kill Process».

Ну конечно


Источники:

1. From Plan to Action: How Well Do Agents Follow the Plan?
2. Running an OpenClaw agent in production: the execution discipline gap · Issue #65490 · openclaw/openclaw · GitHub
3. OpenClaw Architecture and Rapid Scaling: A Technical Briefing
4. GitHub - NousResearch/hermes-agent: The agent that grows with you · GitHub

10

Комментарии (0)

Читайте также:

Цифровой однорукий бандит: почему мы не можем перестать скроллить, даже когда это не приносит удовольствия

Современные платформы превратились в высокотехнологичные лаборатории, которые эксплуатируют нашу нейробиологию ради прибыли. Статья объясняет, как алгоритмы бесконечной ленты взламывают систему вознаграждения мозга и почему в эпоху «экономики внимания» право на скуку становится главной формой сопротивления.

Камеры хранения для будущего: почему детский сад придумали не для детей, а для станков

Детский сад принято считать достижением педагогики, однако его истинные корни уходят в нужды сталелитейной промышленности и мобилизационной экономики. Текст рассказывает, как необходимость освободить руки матерей для работы на заводах превратила воспитание в инструмент по обработке «человеческого капитала». Вы узнаете, почему современная система дошкольного образования — это прежде всего способ поддержания рыночного круговорота, а не только забота о развитии личности.

От забастовок до маринада: как Первомай стал днём капитуляции перед углем

Рассказываем, как праздник революции и борьбы за права рабочих превратился в национальный день шашлыка и эскапизма. В тексте — путь Первомая от чикагских виселиц до современных курьеров, а также ответ на вопрос, почему наш коллективный выезд на дачу стал самой честной формой пассивного протеста против современной экономики.

Вертикальный предел: как стоячие столы стали индустрией по продаже иллюзий

Стоячие столы обещали стать спасением от «убийственного» офисного кресла, но на деле оказались лишь очередным триумфом маркетинга над биологией. Выясняем, почему замена одной статичной позы на другую не приносит реальной пользы и почему обычная прогулка всё ещё эффективнее любого дорогого гаджета.

Финансовый дарвинизм и крах империй: чему нас учит «Трилогия желания» Теодора Драйзера

«Трилогия желания» Теодора Драйзера — это не просто классическая литература, а прикладной учебник по психологии больших денег и устройству капитализма. В тексте разбираем, чему современный лидер может поучиться у Фрэнка Каупервуда и почему главный бизнес-урок всей жизни касается не накопления богатства, а грамотной передачи наследия.