System Design Space
Граф знанийНастройки

Обновлено: 7 апреля 2026 г. в 19:45

Hands-On Large Language Models (short summary)

средний

LLM перестают выглядеть магией, когда становится видно, как токенизация, внимание и архитектура модели проявляются в поведении ответа.

Глава связывает внутреннее устройство модели с прикладными сценариями: классификацией, поиском, RAG, агентными цепочками и дообучением под конкретную задачу.

Для интервью это особенно полезно: можно объяснить механику LLM без отрыва от продуктовых решений, качества ответа и границ системы.

Практическая польза главы

Внутреннее устройство LLM

Глава помогает спокойно объяснить токенизацию, векторные представления, трансформеры и механизм внимания без магического ореола вокруг модели.

Переход к прикладным сценариям

После устройства модели книга сразу показывает классификацию, тематический анализ, генерацию, поиск и мультимодальные задачи.

Мост к AI Engineering

По ней удобно переходить от механики LLM к RAG, агентным сценариям, дообучению и рабочей интеграции модели в продукт.

Материал для интервью

Это хорошая база, чтобы на интервью уверенно говорить и про внутреннее устройство LLM, и про архитектурные решения вокруг них.

Источник

Telegram: Книжный куб

Короткий обзор книги от Александра Поломодова.

Читать пост

Hands-On Large Language Models

Авторы: Jay Alammar, Maarten Grootendorst
Издательство: O'Reilly Media, Inc.
Объём: 428 страниц

Jay Alammar и Maarten Grootendorst: наглядный практический путеводитель по LLM с ~300 иллюстрациями — токенизация, векторные представления, трансформеры, RAG и дообучение.

Оригинал

Об авторах

Книгу написали два специалиста по машинному обучению и искусственному интеллекту, известных тем, что умеют объяснять сложные идеи через наглядные схемы и практические примеры:

Jay Alammar

Engineering Fellow в Cohere, автор известных визуальных разборов по машинному обучению и обработке естественного языка. Его диаграммы используют в документации NumPy и pandas, а также в курсах deeplearning.ai.

jalammar.github.io

Maarten Grootendorst

Data Scientist, автор библиотек BERTopic и KeyBERT с открытым исходным кодом. Специализируется на тематическом моделировании и работе с векторными представлениями текста.

newsletter.maartengrootendorst.com

Философия книги

Авторы придерживаются подхода "сначала интуиция": сначала дают наглядное понимание идеи через визуализации, а уже потом подкрепляют его более формальным объяснением и примерами кода.

~300 авторских иллюстраций

Механизмы внимания, токенизаторы и многомерные пространства векторных представлений разъясняются через схемы, графики и рисунки.

Весь код доступен на GitHub.

Связанная глава

AI Engineering (Chip Huyen)

Более широкий взгляд на рабочую эксплуатацию: RAG, агенты, дообучение и оценивание.

Читать обзор

Структура книги

Книга состоит из трёх частей и 12 глав: сначала она объясняет, как устроены LLM, затем показывает их прикладное использование, а в финале переходит к обучению и дообучению моделей.

По дороге читатель связывает , , и с RAG, агентными сценариями и дообучением.

IПонимание языковых моделей

Первая часть закладывает фундамент и шаг за шагом объясняет, как устроены языковые модели.

1

Введение в языковые модели

Путь от мешка слов и ранних векторных представлений к архитектуре трансформеров. Чем LLM отличаются от предыдущих подходов и почему дают другой масштаб возможностей.

2

Токенизация и векторные представления

Как устроена токенизация в LLM: сравнение слов, подслов, символов и байтов, а также путь от word2vec к современным векторным представлениям.

3

Внутри трансформера

Что происходит при прямом проходе модели: обработка входных токенов, вычисление внимания и выбор следующего токена. Интуитивное объяснение механизма самовнимания и оптимизаций вроде KV-cache.

IIИспользование предобученных моделей

Практические способы использовать готовые LLM и модели векторных представлений для прикладных задач.

Глава 4

Классификация текста

Применение LLM к задачам классификации с минимальным объёмом дополнительного обучения

Глава 5

Кластеризация и тематическое моделирование

BERTopic — библиотека одного из авторов для тематического анализа

Глава 6

Проектирование запросов

Chain of Thought, ReAct, Tree of Thought и другие техники построения подсказок и рассуждений

Глава 7

Продвинутая генерация текстов

LangChain, агенты, память и инструменты для построения сложных рабочих цепочек

Глава 8

Семантический поиск и RAG

RAG расширяет знания модели за счёт извлечения внешнего контекста и поиска по документам

Глава 9

Мультимодальные модели

Текст и изображения: CLIP, BLIP-2 и vision-language-подходы

IIIОбучение и дообучение

Как обучать собственные модели и адаптировать существующие LLM под конкретные задачи.

10

Создание моделей векторных представлений

Обучение собственных моделей векторных представлений для узких доменов и специализированных наборов данных

11

Дообучение для классификации

Адаптация моделей представлений под задачи классификации

12

Дообучение генеративных моделей

Настройка LLM под генерацию текста в конкретном стиле, тоне или домене

Для кого эта книга

  • Инженеров и аналитиков, которым нужен понятный вход в LLM и современные NLP-подходы
  • Разработчиков и аналитиков, которые хотят встроить LLM в рабочие продукты, а не только собрать демо
  • Всех, кто хочет уверенно ориентироваться в современных моделях вроде ChatGPT, Mistral и Claude и понимать, что происходит у них внутри

Связанные главы

  • AI Engineering - Покрывает практики эксплуатации LLM: RAG, оценивание, надёжность и развитие системы после запуска.
  • Prompt Engineering for LLMs - Расширяет тему проектирования запросов и рабочих цепочек, которые в Hands-On LLM показаны как следующий прикладной шаг.
  • An Illustrated Guide to AI Agents (short summary) - Переходит от внутреннего устройства LLM к агентным архитектурам с памятью, инструментами, планированием и координацией шагов.
  • Developing Apps with GPT-4 and ChatGPT (short summary) - Даёт практический мост от понимания LLM к сборке рабочих приложений и их интеграции в продукт.
  • AI Engineering Interviews (short summary) - Помогает закрепить ключевые идеи про LLM через интервью-вопросы, кейсы и архитектурные разборы.

Где найти книгу

Чтобы отмечать прохождение, включи трекинг в Настройки