An Illustrated Guide to AI Agents (short summary)

Агента полезно воспринимать не как новый вид магии, а как систему из состояния, инструментов, планирования и проверок.

Глава показывает, где агентный подход действительно окупается, а где только добавляет оркестрацию, непредсказуемость и операционные риски.

Для интервью и архитектурных обсуждений такой материал помогает говорить не о «модном агенте», а о границах автономии, вызове инструментов, обработке сбоев и цене новой сложности.

Практическая польза главы

Контур агента

Книга раскладывает агентную систему на состояние, планирование, инструменты и проверки, чтобы её можно было обсуждать как архитектуру, а не как магию.

Память и инструменты

По ней удобно объяснять, зачем агенту память, как устроен доступ к внешним системам и почему именно эти слои чаще всего ломают продукт.

Цена автономии

Она помогает честно обсуждать компромиссы автономии: дополнительную оркестрацию, стоимость, непредсказуемость и требования к наблюдаемости.

Материал для интервью

Это хороший каркас для ответа про память, вызов инструментов, планирование, несколько агентов и безопасную деградацию системы.

Первоисточник

O'Reilly Learning

Страница раннего выпуска книги An Illustrated Guide to AI Agents

Открыть книгу

An Illustrated Guide to AI Agents (Иллюстрированный гайд по AI-агентам)

Авторы: Jay Alammar, Maarten Grootendorst
Издательство: O'Reilly Media, Inc. (Early Release)
Объём: Early Release (в процессе написания)

Jay Alammar и Maarten Grootendorst: наглядный практический гид по агентным системам — память, инструменты, планирование, самопроверка, координация нескольких агентов и инженерные риски.

Оригинал

Почему это логичное продолжение после Hands-On LLM

Если Hands-On Large Language Models отвечает на вопрос «как устроена сама модель», то эта книга объясняет, как вокруг неё собрать работоспособную агентную систему.

Шаг 1: понять устройство LLM

Архитектура трансформеров, токены, эмбеддинги, поведение модели во время вывода и её базовые ограничения.

Шаг 2: спроектировать агентное приложение

Память, инструменты, планирование, самопроверка и координация нескольких агентов как отдельная инженерная задача.

Связанная глава

AI Engineering

Практики рабочей эксплуатации AI-систем: оценивание, RAG, агенты и дообучение

Открыть обзор

Что уже готово в книге

Книга пока выходит в формате Early Release, но уже покрывает ядро агентной архитектуры. Опубликованных глав достаточно, чтобы собрать цельную инженерную картину: от памяти и инструментов до планирования и координации нескольких агентов.

Introduction

Зачем нужен агентный подход и где проходит граница между разовым вызовом LLM и полноценной системой.

Составляющие главы:

Что считать агентной системой: чем разовый вызов LLM отличается от цикла «план -> действие -> проверка».
Базовые компоненты: модель, состояние, , слой инструментов и наблюдаемость.
Сценарии, где чат-бота уже недостаточно: многошаговые задачи, интеграции с API и длинные пользовательские процессы.
Критерии успеха архитектуры: надежность, управляемость, , стоимость и воспроизводимость результата.

Reasoning LLMs

Что меняется, когда модель умеет рассуждать во время вывода и как это влияет на архитектуру всего контура.

Составляющие главы:

Чем «гладкий ответ» отличается от реального рассуждения модели на сложных задачах.
Как глубина рассуждения во время вывода влияет на качество, время ответа и стоимость.
Когда стоит выбирать модели с развитым рассуждением, а когда достаточно обычной генерации.
Практики контроля качества рассуждения: проверка шагов, и ограничения по вычислительным ресурсам.

Memory

Краткосрочная и долгосрочная память, хранение состояния между шагами и .

Составляющие главы:

Что держать в окне контекста, а что выносить во внешнее состояние.
Как хранить факты, предпочтения и артефакты выполнения между шагами.
Политики : релевантность, TTL, суммаризация, дедупликация и защита от «захламления» контекста.
Риски памяти: утечки чувствительных данных, дрейф контекста и падение качества при росте состояния.

Tool Usage, Learning, and Protocols

Вызов инструментов, интеграции с внешними системами и протоколы взаимодействия, включая MCP.

Составляющие главы:

Как проектировать контракты инструментов: схемы аргументов, валидацию, типы и границы ответственности.
Цикл : выбор действия, обработка ошибок, повторы и постобработка результата.
Как подключать внешние системы через MCP и смежные подходы и где у этих вариантов архитектурные компромиссы.
Почему переход от генерации текста к выполнению действий сразу повышает требования к безопасности и аудиту.

Planning and Reflection

Декомпозиция задач, пересборка плана и самопроверка как отдельный контур повышения качества.

Составляющие главы:

Как разбивать сложную цель на подзадачи и собирать исполнимый план шагов.
Когда приходится пересматривать план из-за новых данных, сбоев инструментов или смены приоритетов.
Самопроверка и как способ повысить качество и уменьшить грубые ошибки.
Какие ограничения по бюджету, времени и глубине цикла нужны, чтобы планирование не стало слишком дорогим.

Multi-Agent Systems

Разделение ролей, координация нескольких агентов и цена такой архитектурной сложности, включая A2A-сценарии.

Составляющие главы:

Ролевые схемы: планировщик, исследователь, исполнитель и проверяющий, а также правила передачи задачи между ними.
Топологии взаимодействия: центральный координатор, равноправная сеть и иерархия с ведущим агентом.
Согласование общего состояния: общий контекст, протокол обмена сообщениями и контроль конфликтов.
Ключевые риски: каскад ошибок, сложная трассировка и рост инфраструктурных затрат.

Где возникают инженерные риски

Память и управление контекстом

Без явной стратегии хранения и обновления состояния агент быстро теряет релевантность: растёт задержка, контекст размывается, а стоимость токенов становится непредсказуемой.

Инструменты и безопасные интеграции

Подключение инструментов переводит систему из режима генерации текста в режим действий. Ошибка в правах, валидации или логике повторов становится уже риском для рабочей системы.

Планирование и цена качества

Циклы самопроверки могут улучшать ответы, но увеличивают число вызовов модели. Поэтому нужны ограничения по бюджету, таймаутам и глубине планирования.

Координация нескольких агентов

Подход с несколькими агентами помогает разделять роли, но усложняет наблюдаемость, трассировку ошибок и контроль согласованности результата.

Кому полезно и как читать

Для кого

Инженерам и тимлидам, которые проектируют AI-функции не как демо, а как продуктовые системы.
Командам, которым нужна рабочая инженерная картина: память, инструменты, планирование и оркестрация.
Тем, кто уже освоил базу по LLM и хочет перейти к агентным архитектурам и сценариям с несколькими агентами.

Что смотреть отдельно

В разделах про работу с инструментами и системы из нескольких агентов полезно отдельно сравнить MCP и A2A: выбор протокола влияет на границы ответственности, наблюдаемость и устойчивость всей системы.

Связанные главы

Hands-On Large Language Models - Даёт базовое понимание устройства LLM, на котором потом строятся память, планирование и работа с инструментами в агентной системе.
AI Engineering - Показывает, как доводить агентные сценарии до рабочей эксплуатации: оценивание, RAG, наблюдаемость и эксплуатационную надёжность.
Prompt Engineering for LLMs - Углубляет проектирование запросов и рабочих цепочек, из которых вырастают планировщики и циклы вызова инструментов.
Developing Apps with GPT-4 and ChatGPT - Показывает прикладную сборку LLM-приложений и служит хорошим мостом к более зрелым агентным архитектурам.
AI в SDLC: путь от ассистентов к агентам от Александра Поломодова - Даёт контекст перехода от ассистентов к агентам и показывает реальные инженерные компромиссы внедрения в командах.

Где найти книгу

Оригинал

learning.oreilly.com

An Illustrated Guide to AI Agents

An Illustrated Guide to AI Agents (short summary)

Практическая польза главы

An Illustrated Guide to AI Agents (Иллюстрированный гайд по AI-агентам)

Почему это логичное продолжение после Hands-On LLM

Шаг 1: понять устройство LLM

Шаг 2: спроектировать агентное приложение

Что уже готово в книге

Introduction

Reasoning LLMs

Memory

Tool Usage, Learning, and Protocols

Planning and Reflection

Multi-Agent Systems

Где возникают инженерные риски

Память и управление контекстом

Инструменты и безопасные интеграции

Планирование и цена качества

Координация нескольких агентов

Кому полезно и как читать

Для кого

Рекомендуемый порядок

Что смотреть отдельно

Связанные главы

Где найти книгу