Вайбкодинг, AI агенты
Как строить AI-агентов: разбор гайда Anthropic
Практический разбор от инженеров Anthropic: паттерны, выбор инструментов (ACI) и почему простые воркфлоу надежнее.

Как строить AI-агентов, чтобы они реально работали
Адаптированная русская версия по мотивам статьи Anthropic «Building Effective Agents» от 19 декабря 2024 года. Это не дословный перевод, а понятная переработка для читателя, который не живёт внутри AI- и вайб-кодинг-тусовки.
Суть
Коротко:не нужно сразу строить огромного умного агента с кучей магии. Чаще всего лучше работает более простая схема: обычный запрос к модели, плюс понятные инструменты, плюс несколько аккуратно собранных шагов.
Сложность стоит добавлять только тогда, когда она реально улучшает результат, а не просто красиво звучит.
Что вообще Anthropic называет агентом
Вокруг слова «агент» много путаницы. Кто-то так называет любой сценарий, где ИИ делает больше одного шага. Кто-то имеет в виду почти автономного помощника, который сам планирует работу и сам вызывает инструменты.
Anthropic предлагает простое разделение. Есть workflow — это когда путь заранее прописан человеком. А есть agent — это когда модель сама решает, что делать дальше, какими инструментами пользоваться и в каком порядке идти к результату.
Простое объяснение:
- Workflow — это как чек-лист: сначала A, потом B, потом C.
- Agent — это как исполнитель, которому дали цель, а маршрут он выбирает сам.
Когда агент вообще не нужен
Это один из самых сильных моментов статьи, и многие его как раз пропускают. Anthropic прямо говорит: начинайте с самого простого решения. Иногда хватает одного хорошего промпта, пары примеров и доступа к нужной информации.
- Если задача понятная и повторяемая, не надо тащить туда автономного агента.
- Чем сложнее система, тем выше цена, задержка и шанс, что ошибка потянет за собой следующую ошибку.
- Агентность — не знак качества сама по себе. Это просто инструмент, который подходит не всегда.
Фреймворки полезны, но не спасают от непонимания
Статья не ругает фреймворки, но приземляет ожидания. Они помогают быстро стартовать: удобнее вызывать модели, связывать шаги и подключать инструменты. Но у них есть минус: они прячут реальную механику под капотом.
Из-за этого команде становится сложнее понять, почему система ошиблась. Появляется лишняя абстракция, и вместе с ней — лишняя хрупкость. Поэтому совет простой: сначала поймите базовую логику напрямую через API, и только потом, если надо, надстраивайте удобные оболочки.
Базовый кирпичик: усиленная LLM
Основа почти любой такой системы — не «магический агент», а обычная языковая модель, которую усилили полезными штуками. В статье это называют augmented LLM.
- retrieval — модель может подтягивать нужные документы, статьи, базу знаний.
- tools — модель может вызвать внешний инструмент: поиск, калькулятор, код, CRM, API.
- memory — система может сохранять важный контекст и использовать его дальше.
Если говорить совсем по-простому, то смысл такой: сама по себе модель умеет генерировать текст. Но когда вы даёте ей доступ к данным, действиям и памяти, она начинает не просто болтать, а реально что-то делать.
Термин без боли:Model Context Protocol (MCP), который упоминается в статье, — это способ стандартно подключать к модели внешние инструменты и сервисы. Идея простая: не собирать каждый раз свой велосипед, а иметь общий понятный формат подключения.
Пять рабочих схем из статьи

| Схема | Что это простыми словами | Когда использовать |
|---|---|---|
| Prompt chaining | Одна модель делает шаг 1, потом шаг 2, потом шаг 3. | Когда задачу можно разложить на понятную последовательность. |
| Routing | Система сначала понимает, что за запрос пришёл, и отправляет его по нужному сценарию. | Когда есть разные типы задач и для каждой нужен свой подход. |
| Parallelization | Несколько вызовов модели работают одновременно. | Когда важны скорость, несколько точек зрения или независимая проверка. |
| Orchestrator-workers | Один ИИ выступает диспетчером и сам раздаёт подзадачи другим ИИ. | Когда заранее непонятно, какие именно шаги понадобятся. |
| Evaluator-optimizer | Один ИИ пишет, второй проверяет и отправляет на доработку. | Когда результат можно улучшать по чётким критериям. |
1. Prompt chaining
Это цепочка шагов. Первая модель делает заготовку. Вторая — проверяет. Третья — превращает это в финальный результат. Между шагами можно ставить проверки, чтобы система не уехала в сторону.
Это хорошо работает там, где большую задачу можно честно разрезать на несколько маленьких. Например: сначала собрать структуру статьи, потом проверить, не развалилась ли логика, потом уже писать текст целиком.
2. Routing
Здесь задача сначала классифицируется. Система понимает, что именно ей принесли, и отправляет запрос в нужную ветку. Один тип вопросов идёт в поддержку, другой — в возвраты, третий — в техпомощь.
Смысл простой: не пытаться одним промптом решить вообще всё. Разные типы задач лучше обслуживать разными сценариями.
3. Parallelization
Это когда несколько вызовов модели работают одновременно. Иногда задачу делят на независимые куски. Иногда одну и ту же задачу дают нескольким запускам, чтобы получить несколько версий ответа и потом сверить их.
Anthropic отдельно показывает важную мысль: если у задачи несколько аспектов, часто лучше дать каждому аспекту отдельное внимание, чем заставлять один вызов модели держать всё сразу в голове.
4. Orchestrator-workers
Тут появляется диспетчер. Один ИИ получает большую задачу, сам разбивает её на части, раздаёт подзадачи другим моделям и потом собирает результат обратно.
Это уже полезно там, где заранее нельзя прописать точный план. Например, в сложной работе с кодом или в исследовательском поиске, где только по ходу становится понятно, в какие стороны вообще нужно копать.
5. Evaluator-optimizer
Здесь один ИИ делает первую версию, а второй ИИ выступает редактором или критиком. Он проверяет результат, даёт замечания, и цикл повторяется.
Этот подход особенно силён там, где качество можно улучшать итерациями: перевод, письмо, аналитика, поиск информации. По сути это цифровая версия нормального человеческого процесса: написать, пересмотреть, допилить.
Что такое «настоящий» агент в этой логике
Настоящий агент начинается там, где система уже не идёт по жёстко прописанному сценарию. Ей ставят цель, дают инструменты, и дальше она сама решает, что делать: что проверить, что открыть, какой шаг сделать следующим.
Но здесь есть важная оговорка. Автономность звучит красиво, а на практике приносит цену. Такой системе нужно больше времени, больше вызовов модели и больше контроля. Если она ошиблась на раннем этапе, ошибка может накапливаться дальше.
Почему в статье звучит фраза ground truth
Ground truth — это проверка об реальность. Не «модель думает, что всё хорошо», а есть конкретный факт из среды: результат теста, ответ инструмента, состояние файла, данные из базы. Без такой проверки агент может уверенно идти не туда.
Когда агенты реально дают пользу
- Когда заранее невозможно предсказать все шаги.
- Когда задачу можно проверять по внешнему результату: тесты, статусы, данные, действия.
- Когда система работает в достаточно контролируемой среде.
- When there are breakpoints where a human can step in if things go wrong.
В приложении к статье Anthropic приводит два особенно сильных кейса: поддержку клиентов и работу с кодом. В обоих случаях агент не просто разговаривает, а получает обратную связь от среды и может совершать действия, которые потом можно проверить.
Почему инструменты важнее промптов (ACI)
Качество работы вашего агента часто упирается не в «гениальность» промпта, а в качество проектирования его инструментов (ACI — Agent-Computer Interface).
Anthropic приводит простой пример: когда агент работал с относительными путями к файлам в кодовой базе, он постоянно путался и ошибался. Как только инструменты перевели на обязательное использование абсолютных путей — количество ошибок резко снизилось.
Секрет надежности ИИ-систем прост:
- Давать инструментам предельно очевидные названия и описания.
- Делать интерфейсы вызова удобными для модели, а не только для вас.
- Максимально жестко валидировать входящие параметры, чтобы отсекать ошибки до того, как они сломают систему.
| Проблема | Решение (По правилам ACI) | Результат внедрения |
|---|---|---|
| ИИ путается в структуре файлов и относительных путях | Переход на обязательные абсолютные пути | Резкое снижение количества ошибок ИИ |
| Непонятные названия инструментов для ИИ | Давать предельно очевидные имена и описания | ИИ безошибочно выбирает нужный инструмент |
| Сложный, невалидированный входной формат | Жесткая валидация параметров на входе | Ошибки отсекаются до того, как сломают систему |
С чего начать
Если вы хотите автоматизировать процесс или запустить ИИ-продукт, двигайтесь по ступеням:
| Шаг | Подход (Метод) | Когда использовать |
|---|---|---|
| Шаг 1: Few-shot | Один хороший промпт с качественными примерами | Когда задача понятная, простая и не требует вызовов API |
| Шаг 2: Prompt Chaining | Разложение задачи на цепочку последовательных шагов | Когда не хватает точности выполнения в один шаг |
| Шаг 3: Retrieval & Tools | Добавление доступа к данным и внешним действиям | Когда ИИ нужны внешние документы, базы данных или API |
| Шаг 4: Autonomous Agent | Нелинейное планирование в меняющейся среде | Только если сценарий нельзя жестко прописать заранее |
И помните: лучший агент — это не самый сложный. Это тот, который стабильно решает задачу, не требуя вашего внимания на исправление его ошибок.
FAQ
Что такое Model Context Protocol (MCP), о котором сейчас все говорят?+
Это открытый стандарт от Anthropic, который позволяет подключать к ИИ любые источники данных и инструменты (базы данных, файлы, API) по единому универсальному протоколу, не изобретая каждый раз кастомную интеграцию.
Почему фреймворки вроде LangChain часто критикуют в продакшене?+
Они создают лишний слой абстракции. Когда система ломается или выдает непредсказуемый результат, разработчикам крайне сложно отладить внутренние вызовы и понять, на каком именно этапе произошел сбой.
Дальше по теме