Агента полезно воспринимать не как новый вид магии, а как систему из состояния, инструментов, планирования и проверок.
Глава показывает, где агентный подход действительно окупается, а где только добавляет оркестрацию, непредсказуемость и операционные риски.
Для интервью и архитектурных обсуждений такой материал помогает говорить не о «модном агенте», а о границах автономии, вызове инструментов, обработке сбоев и цене новой сложности.
Практическая польза главы
Контур агента
Книга раскладывает агентную систему на состояние, планирование, инструменты и проверки, чтобы её можно было обсуждать как архитектуру, а не как магию.
Память и инструменты
По ней удобно объяснять, зачем агенту память, как устроен доступ к внешним системам и почему именно эти слои чаще всего ломают продукт.
Цена автономии
Она помогает честно обсуждать компромиссы автономии: дополнительную оркестрацию, стоимость, непредсказуемость и требования к наблюдаемости.
Материал для интервью
Это хороший каркас для ответа про память, вызов инструментов, планирование, несколько агентов и безопасную деградацию системы.
Первоисточник
O'Reilly Learning
Страница раннего выпуска книги An Illustrated Guide to AI Agents
An Illustrated Guide to AI Agents (Иллюстрированный гайд по AI-агентам)
Авторы: Jay Alammar, Maarten Grootendorst
Издательство: O'Reilly Media, Inc. (Early Release)
Объём: Early Release (в процессе написания)
Jay Alammar и Maarten Grootendorst: наглядный практический гид по агентным системам — память, инструменты, планирование, самопроверка, координация нескольких агентов и инженерные риски.
Почему это логичное продолжение после Hands-On LLM
Если Hands-On Large Language Models отвечает на вопрос «как устроена сама модель», то эта книга объясняет, как вокруг неё собрать работоспособную агентную систему.
Шаг 1: понять устройство LLM
Архитектура трансформеров, токены, эмбеддинги, поведение модели во время вывода и её базовые ограничения.
Шаг 2: спроектировать агентное приложение
Память, инструменты, планирование, самопроверка и координация нескольких агентов как отдельная инженерная задача.
Связанная глава
AI Engineering
Практики рабочей эксплуатации AI-систем: оценивание, RAG, агенты и дообучение
Что уже готово в книге
Книга пока выходит в формате Early Release, но уже покрывает ядро агентной архитектуры. Опубликованных глав достаточно, чтобы собрать цельную инженерную картину: от памяти и инструментов до планирования и координации нескольких агентов.
Introduction
Зачем нужен агентный подход и где проходит граница между разовым вызовом LLM и полноценной системой.
Составляющие главы:
- Что считать агентной системой: чем разовый вызов LLM отличается от цикла «план -> действие -> проверка».
- Базовые компоненты: модель, состояние, , слой инструментов и наблюдаемость.
- Сценарии, где чат-бота уже недостаточно: многошаговые задачи, интеграции с API и длинные пользовательские процессы.
- Критерии успеха архитектуры: надежность, управляемость, , стоимость и воспроизводимость результата.
Reasoning LLMs
Что меняется, когда модель умеет рассуждать во время вывода и как это влияет на архитектуру всего контура.
Составляющие главы:
- Чем «гладкий ответ» отличается от реального рассуждения модели на сложных задачах.
- Как глубина рассуждения во время вывода влияет на качество, время ответа и стоимость.
- Когда стоит выбирать модели с развитым рассуждением, а когда достаточно обычной генерации.
- Практики контроля качества рассуждения: проверка шагов, и ограничения по вычислительным ресурсам.
Memory
Краткосрочная и долгосрочная память, хранение состояния между шагами и .
Составляющие главы:
- Что держать в окне контекста, а что выносить во внешнее состояние.
- Как хранить факты, предпочтения и артефакты выполнения между шагами.
- Политики : релевантность, TTL, суммаризация, дедупликация и защита от «захламления» контекста.
- Риски памяти: утечки чувствительных данных, дрейф контекста и падение качества при росте состояния.
Tool Usage, Learning, and Protocols
Вызов инструментов, интеграции с внешними системами и протоколы взаимодействия, включая MCP.
Составляющие главы:
- Как проектировать контракты инструментов: схемы аргументов, валидацию, типы и границы ответственности.
- Цикл : выбор действия, обработка ошибок, повторы и постобработка результата.
- Как подключать внешние системы через MCP и смежные подходы и где у этих вариантов архитектурные компромиссы.
- Почему переход от генерации текста к выполнению действий сразу повышает требования к безопасности и аудиту.
Planning and Reflection
Декомпозиция задач, пересборка плана и самопроверка как отдельный контур повышения качества.
Составляющие главы:
- Как разбивать сложную цель на подзадачи и собирать исполнимый план шагов.
- Когда приходится пересматривать план из-за новых данных, сбоев инструментов или смены приоритетов.
- Самопроверка и как способ повысить качество и уменьшить грубые ошибки.
- Какие ограничения по бюджету, времени и глубине цикла нужны, чтобы планирование не стало слишком дорогим.
Multi-Agent Systems
Разделение ролей, координация нескольких агентов и цена такой архитектурной сложности, включая A2A-сценарии.
Составляющие главы:
- Ролевые схемы: планировщик, исследователь, исполнитель и проверяющий, а также правила передачи задачи между ними.
- Топологии взаимодействия: центральный координатор, равноправная сеть и иерархия с ведущим агентом.
- Согласование общего состояния: общий контекст, протокол обмена сообщениями и контроль конфликтов.
- Ключевые риски: каскад ошибок, сложная трассировка и рост инфраструктурных затрат.
Где возникают инженерные риски
Память и управление контекстом
Без явной стратегии хранения и обновления состояния агент быстро теряет релевантность: растёт задержка, контекст размывается, а стоимость токенов становится непредсказуемой.
Инструменты и безопасные интеграции
Подключение инструментов переводит систему из режима генерации текста в режим действий. Ошибка в правах, валидации или логике повторов становится уже риском для рабочей системы.
Планирование и цена качества
Циклы самопроверки могут улучшать ответы, но увеличивают число вызовов модели. Поэтому нужны ограничения по бюджету, таймаутам и глубине планирования.
Координация нескольких агентов
Подход с несколькими агентами помогает разделять роли, но усложняет наблюдаемость, трассировку ошибок и контроль согласованности результата.
Кому полезно и как читать
Для кого
- Инженерам и тимлидам, которые проектируют AI-функции не как демо, а как продуктовые системы.
- Командам, которым нужна рабочая инженерная картина: память, инструменты, планирование и оркестрация.
- Тем, кто уже освоил базу по LLM и хочет перейти к агентным архитектурам и сценариям с несколькими агентами.
Рекомендуемый порядок
- Сначала пройти главу Hands-On Large Language Models, чтобы закрепить базовое понимание устройства LLM.
- Затем читать An Illustrated Guide to AI Agents как архитектурное продолжение вокруг самой модели.
- После этого закрепить практики рабочей эксплуатации через AI Engineering и соседнюю главу про проектирование запросов для LLM.
Что смотреть отдельно
В разделах про работу с инструментами и системы из нескольких агентов полезно отдельно сравнить MCP и A2A: выбор протокола влияет на границы ответственности, наблюдаемость и устойчивость всей системы.
Связанные главы
- Hands-On Large Language Models - Даёт базовое понимание устройства LLM, на котором потом строятся память, планирование и работа с инструментами в агентной системе.
- AI Engineering - Показывает, как доводить агентные сценарии до рабочей эксплуатации: оценивание, RAG, наблюдаемость и эксплуатационную надёжность.
- Prompt Engineering for LLMs - Углубляет проектирование запросов и рабочих цепочек, из которых вырастают планировщики и циклы вызова инструментов.
- Developing Apps with GPT-4 and ChatGPT - Показывает прикладную сборку LLM-приложений и служит хорошим мостом к более зрелым агентным архитектурам.
- AI в SDLC: путь от ассистентов к агентам от Александра Поломодова - Даёт контекст перехода от ассистентов к агентам и показывает реальные инженерные компромиссы внедрения в командах.
