AL

Вайбкодинг, AI агенты

Как строить AI-агентов: разбор гайда Anthropic

Практический разбор от инженеров Anthropic: паттерны, выбор инструментов (ACI) и почему простые воркфлоу надежнее.

2026-06-03/9 мин/Артём Лизгаро
Обложка статьи: Как строить AI-агентов: разбор гайда Anthropic

Как строить AI-агентов, чтобы они реально работали

Адаптированная русская версия по мотивам статьи Anthropic «Building Effective Agents» от 19 декабря 2024 года. Это не дословный перевод, а понятная переработка для читателя, который не живёт внутри AI- и вайб-кодинг-тусовки.

Суть

Коротко:не нужно сразу строить огромного умного агента с кучей магии. Чаще всего лучше работает более простая схема: обычный запрос к модели, плюс понятные инструменты, плюс несколько аккуратно собранных шагов.

Сложность стоит добавлять только тогда, когда она реально улучшает результат, а не просто красиво звучит.

Что вообще Anthropic называет агентом

Вокруг слова «агент» много путаницы. Кто-то так называет любой сценарий, где ИИ делает больше одного шага. Кто-то имеет в виду почти автономного помощника, который сам планирует работу и сам вызывает инструменты.

Anthropic предлагает простое разделение. Есть workflow — это когда путь заранее прописан человеком. А есть agent — это когда модель сама решает, что делать дальше, какими инструментами пользоваться и в каком порядке идти к результату.

Простое объяснение:

  • Workflow — это как чек-лист: сначала A, потом B, потом C.
  • Agent — это как исполнитель, которому дали цель, а маршрут он выбирает сам.

Когда агент вообще не нужен

Это один из самых сильных моментов статьи, и многие его как раз пропускают. Anthropic прямо говорит: начинайте с самого простого решения. Иногда хватает одного хорошего промпта, пары примеров и доступа к нужной информации.

  • Если задача понятная и повторяемая, не надо тащить туда автономного агента.
  • Чем сложнее система, тем выше цена, задержка и шанс, что ошибка потянет за собой следующую ошибку.
  • Агентность — не знак качества сама по себе. Это просто инструмент, который подходит не всегда.

Фреймворки полезны, но не спасают от непонимания

Статья не ругает фреймворки, но приземляет ожидания. Они помогают быстро стартовать: удобнее вызывать модели, связывать шаги и подключать инструменты. Но у них есть минус: они прячут реальную механику под капотом.

Из-за этого команде становится сложнее понять, почему система ошиблась. Появляется лишняя абстракция, и вместе с ней — лишняя хрупкость. Поэтому совет простой: сначала поймите базовую логику напрямую через API, и только потом, если надо, надстраивайте удобные оболочки.

Базовый кирпичик: усиленная LLM

Основа почти любой такой системы — не «магический агент», а обычная языковая модель, которую усилили полезными штуками. В статье это называют augmented LLM.

  • retrieval — модель может подтягивать нужные документы, статьи, базу знаний.
  • tools — модель может вызвать внешний инструмент: поиск, калькулятор, код, CRM, API.
  • memory — система может сохранять важный контекст и использовать его дальше.

Если говорить совсем по-простому, то смысл такой: сама по себе модель умеет генерировать текст. Но когда вы даёте ей доступ к данным, действиям и памяти, она начинает не просто болтать, а реально что-то делать.

Термин без боли:Model Context Protocol (MCP), который упоминается в статье, — это способ стандартно подключать к модели внешние инструменты и сервисы. Идея простая: не собирать каждый раз свой велосипед, а иметь общий понятный формат подключения.

Пять рабочих схем из статьи

Иллюстрация AI-агентов

СхемаЧто это простыми словамиКогда использовать
Prompt chainingОдна модель делает шаг 1, потом шаг 2, потом шаг 3.Когда задачу можно разложить на понятную последовательность.
RoutingСистема сначала понимает, что за запрос пришёл, и отправляет его по нужному сценарию.Когда есть разные типы задач и для каждой нужен свой подход.
ParallelizationНесколько вызовов модели работают одновременно.Когда важны скорость, несколько точек зрения или независимая проверка.
Orchestrator-workersОдин ИИ выступает диспетчером и сам раздаёт подзадачи другим ИИ.Когда заранее непонятно, какие именно шаги понадобятся.
Evaluator-optimizerОдин ИИ пишет, второй проверяет и отправляет на доработку.Когда результат можно улучшать по чётким критериям.

1. Prompt chaining

Это цепочка шагов. Первая модель делает заготовку. Вторая — проверяет. Третья — превращает это в финальный результат. Между шагами можно ставить проверки, чтобы система не уехала в сторону.

Это хорошо работает там, где большую задачу можно честно разрезать на несколько маленьких. Например: сначала собрать структуру статьи, потом проверить, не развалилась ли логика, потом уже писать текст целиком.

2. Routing

Здесь задача сначала классифицируется. Система понимает, что именно ей принесли, и отправляет запрос в нужную ветку. Один тип вопросов идёт в поддержку, другой — в возвраты, третий — в техпомощь.

Смысл простой: не пытаться одним промптом решить вообще всё. Разные типы задач лучше обслуживать разными сценариями.

3. Parallelization

Это когда несколько вызовов модели работают одновременно. Иногда задачу делят на независимые куски. Иногда одну и ту же задачу дают нескольким запускам, чтобы получить несколько версий ответа и потом сверить их.

Anthropic отдельно показывает важную мысль: если у задачи несколько аспектов, часто лучше дать каждому аспекту отдельное внимание, чем заставлять один вызов модели держать всё сразу в голове.

4. Orchestrator-workers

Тут появляется диспетчер. Один ИИ получает большую задачу, сам разбивает её на части, раздаёт подзадачи другим моделям и потом собирает результат обратно.

Это уже полезно там, где заранее нельзя прописать точный план. Например, в сложной работе с кодом или в исследовательском поиске, где только по ходу становится понятно, в какие стороны вообще нужно копать.

5. Evaluator-optimizer

Здесь один ИИ делает первую версию, а второй ИИ выступает редактором или критиком. Он проверяет результат, даёт замечания, и цикл повторяется.

Этот подход особенно силён там, где качество можно улучшать итерациями: перевод, письмо, аналитика, поиск информации. По сути это цифровая версия нормального человеческого процесса: написать, пересмотреть, допилить.

Что такое «настоящий» агент в этой логике

Настоящий агент начинается там, где система уже не идёт по жёстко прописанному сценарию. Ей ставят цель, дают инструменты, и дальше она сама решает, что делать: что проверить, что открыть, какой шаг сделать следующим.

Но здесь есть важная оговорка. Автономность звучит красиво, а на практике приносит цену. Такой системе нужно больше времени, больше вызовов модели и больше контроля. Если она ошиблась на раннем этапе, ошибка может накапливаться дальше.

Почему в статье звучит фраза ground truth

Ground truth — это проверка об реальность. Не «модель думает, что всё хорошо», а есть конкретный факт из среды: результат теста, ответ инструмента, состояние файла, данные из базы. Без такой проверки агент может уверенно идти не туда.

Когда агенты реально дают пользу

  • Когда заранее невозможно предсказать все шаги.
  • Когда задачу можно проверять по внешнему результату: тесты, статусы, данные, действия.
  • Когда система работает в достаточно контролируемой среде.
  • When there are breakpoints where a human can step in if things go wrong.

В приложении к статье Anthropic приводит два особенно сильных кейса: поддержку клиентов и работу с кодом. В обоих случаях агент не просто разговаривает, а получает обратную связь от среды и может совершать действия, которые потом можно проверить.

Почему инструменты важнее промптов (ACI)

Качество работы вашего агента часто упирается не в «гениальность» промпта, а в качество проектирования его инструментов (ACI — Agent-Computer Interface).

Anthropic приводит простой пример: когда агент работал с относительными путями к файлам в кодовой базе, он постоянно путался и ошибался. Как только инструменты перевели на обязательное использование абсолютных путей — количество ошибок резко снизилось.

Секрет надежности ИИ-систем прост:

  1. Давать инструментам предельно очевидные названия и описания.
  2. Делать интерфейсы вызова удобными для модели, а не только для вас.
  3. Максимально жестко валидировать входящие параметры, чтобы отсекать ошибки до того, как они сломают систему.
ПроблемаРешение (По правилам ACI)Результат внедрения
ИИ путается в структуре файлов и относительных путяхПереход на обязательные абсолютные путиРезкое снижение количества ошибок ИИ
Непонятные названия инструментов для ИИДавать предельно очевидные имена и описанияИИ безошибочно выбирает нужный инструмент
Сложный, невалидированный входной форматЖесткая валидация параметров на входеОшибки отсекаются до того, как сломают систему

С чего начать

Если вы хотите автоматизировать процесс или запустить ИИ-продукт, двигайтесь по ступеням:

ШагПодход (Метод)Когда использовать
Шаг 1: Few-shotОдин хороший промпт с качественными примерамиКогда задача понятная, простая и не требует вызовов API
Шаг 2: Prompt ChainingРазложение задачи на цепочку последовательных шаговКогда не хватает точности выполнения в один шаг
Шаг 3: Retrieval & ToolsДобавление доступа к данным и внешним действиямКогда ИИ нужны внешние документы, базы данных или API
Шаг 4: Autonomous AgentНелинейное планирование в меняющейся средеТолько если сценарий нельзя жестко прописать заранее

И помните: лучший агент — это не самый сложный. Это тот, который стабильно решает задачу, не требуя вашего внимания на исправление его ошибок.

FAQ

Что такое Model Context Protocol (MCP), о котором сейчас все говорят?+

Это открытый стандарт от Anthropic, который позволяет подключать к ИИ любые источники данных и инструменты (базы данных, файлы, API) по единому универсальному протоколу, не изобретая каждый раз кастомную интеграцию.

Почему фреймворки вроде LangChain часто критикуют в продакшене?+

Они создают лишний слой абстракции. Когда система ломается или выдает непредсказуемый результат, разработчикам крайне сложно отладить внутренние вызовы и понять, на каком именно этапе произошел сбой.

Дальше по теме