LLM перестают выглядеть магией, когда становится видно, как токенизация, внимание и архитектура модели проявляются в поведении ответа.
Глава связывает внутреннее устройство модели с прикладными сценариями: классификацией, поиском, RAG, агентными цепочками и дообучением под конкретную задачу.
Для интервью это особенно полезно: можно объяснить механику LLM без отрыва от продуктовых решений, качества ответа и границ системы.
Практическая польза главы
Внутреннее устройство LLM
Глава помогает спокойно объяснить токенизацию, векторные представления, трансформеры и механизм внимания без магического ореола вокруг модели.
Переход к прикладным сценариям
После устройства модели книга сразу показывает классификацию, тематический анализ, генерацию, поиск и мультимодальные задачи.
Мост к AI Engineering
По ней удобно переходить от механики LLM к RAG, агентным сценариям, дообучению и рабочей интеграции модели в продукт.
Материал для интервью
Это хорошая база, чтобы на интервью уверенно говорить и про внутреннее устройство LLM, и про архитектурные решения вокруг них.
Источник
Telegram: Книжный куб
Короткий обзор книги от Александра Поломодова.
Hands-On Large Language Models
Авторы: Jay Alammar, Maarten Grootendorst
Издательство: O'Reilly Media, Inc.
Объём: 428 страниц
Jay Alammar и Maarten Grootendorst: наглядный практический путеводитель по LLM с ~300 иллюстрациями — токенизация, векторные представления, трансформеры, RAG и дообучение.
Об авторах
Книгу написали два специалиста по машинному обучению и искусственному интеллекту, известных тем, что умеют объяснять сложные идеи через наглядные схемы и практические примеры:
Jay Alammar
Engineering Fellow в Cohere, автор известных визуальных разборов по машинному обучению и обработке естественного языка. Его диаграммы используют в документации NumPy и pandas, а также в курсах deeplearning.ai.
jalammar.github.ioMaarten Grootendorst
Data Scientist, автор библиотек BERTopic и KeyBERT с открытым исходным кодом. Специализируется на тематическом моделировании и работе с векторными представлениями текста.
newsletter.maartengrootendorst.comФилософия книги
Авторы придерживаются подхода "сначала интуиция": сначала дают наглядное понимание идеи через визуализации, а уже потом подкрепляют его более формальным объяснением и примерами кода.
~300 авторских иллюстраций
Механизмы внимания, токенизаторы и многомерные пространства векторных представлений разъясняются через схемы, графики и рисунки.
Весь код доступен на GitHub.
Связанная глава
AI Engineering (Chip Huyen)
Более широкий взгляд на рабочую эксплуатацию: RAG, агенты, дообучение и оценивание.
Структура книги
Книга состоит из трёх частей и 12 глав: сначала она объясняет, как устроены LLM, затем показывает их прикладное использование, а в финале переходит к обучению и дообучению моделей.
По дороге читатель связывает , , и с RAG, агентными сценариями и дообучением.
IПонимание языковых моделей
Первая часть закладывает фундамент и шаг за шагом объясняет, как устроены языковые модели.
Введение в языковые модели
Путь от мешка слов и ранних векторных представлений к архитектуре трансформеров. Чем LLM отличаются от предыдущих подходов и почему дают другой масштаб возможностей.
Токенизация и векторные представления
Как устроена токенизация в LLM: сравнение слов, подслов, символов и байтов, а также путь от word2vec к современным векторным представлениям.
Внутри трансформера
Что происходит при прямом проходе модели: обработка входных токенов, вычисление внимания и выбор следующего токена. Интуитивное объяснение механизма самовнимания и оптимизаций вроде KV-cache.
IIИспользование предобученных моделей
Практические способы использовать готовые LLM и модели векторных представлений для прикладных задач.
Классификация текста
Применение LLM к задачам классификации с минимальным объёмом дополнительного обучения
Кластеризация и тематическое моделирование
BERTopic — библиотека одного из авторов для тематического анализа
Проектирование запросов
Chain of Thought, ReAct, Tree of Thought и другие техники построения подсказок и рассуждений
Продвинутая генерация текстов
LangChain, агенты, память и инструменты для построения сложных рабочих цепочек
Семантический поиск и RAG
RAG расширяет знания модели за счёт извлечения внешнего контекста и поиска по документам
Мультимодальные модели
Текст и изображения: CLIP, BLIP-2 и vision-language-подходы
IIIОбучение и дообучение
Как обучать собственные модели и адаптировать существующие LLM под конкретные задачи.
Создание моделей векторных представлений
Обучение собственных моделей векторных представлений для узких доменов и специализированных наборов данных
Дообучение для классификации
Адаптация моделей представлений под задачи классификации
Дообучение генеративных моделей
Настройка LLM под генерацию текста в конкретном стиле, тоне или домене
Для кого эта книга
- Инженеров и аналитиков, которым нужен понятный вход в LLM и современные NLP-подходы
- Разработчиков и аналитиков, которые хотят встроить LLM в рабочие продукты, а не только собрать демо
- Всех, кто хочет уверенно ориентироваться в современных моделях вроде ChatGPT, Mistral и Claude и понимать, что происходит у них внутри
Связанные главы
- AI Engineering - Покрывает практики эксплуатации LLM: RAG, оценивание, надёжность и развитие системы после запуска.
- Prompt Engineering for LLMs - Расширяет тему проектирования запросов и рабочих цепочек, которые в Hands-On LLM показаны как следующий прикладной шаг.
- An Illustrated Guide to AI Agents (short summary) - Переходит от внутреннего устройства LLM к агентным архитектурам с памятью, инструментами, планированием и координацией шагов.
- Developing Apps with GPT-4 and ChatGPT (short summary) - Даёт практический мост от понимания LLM к сборке рабочих приложений и их интеграции в продукт.
- AI Engineering Interviews (short summary) - Помогает закрепить ключевые идеи про LLM через интервью-вопросы, кейсы и архитектурные разборы.
