System Design Space
Граф знанийНастройки

Обновлено: 7 апреля 2026 г. в 19:45

AI Engineering (short summary)

сложный

AI-инженерия становится отдельной дисциплиной в тот момент, когда модель перестаёт быть эффектным демо и начинает определять поведение продукта, его стоимость и эксплуатацию.

Глава собирает базовые модели, проектирование запросов, RAG, агентные сценарии и дообучение в один инженерный контур, где важны не модные паттерны сами по себе, а качество ответа, управляемость и границы риска.

Для интервью и архитектурных обсуждений она полезна как карта решений вокруг модели: как оценивать систему, где ставить защитные ограничения, когда усложнять архитектуру и как думать о рабочем контуре целиком.

Практическая польза главы

Контур AI-продукта

Книга собирает модель, контекст, знания, инструменты и эксплуатацию в один продуктовый контур, а не в набор изолированных техник.

Оценивание и качество

Она помогает обсуждать AI через проверку качества, продуктовые метрики, ручную проверку и расследование деградаций, а не только через модель.

От запроса к системе

По книге удобно разбирать, как путь от проектирования запросов к RAG, агентам и дообучению усложняется по мере роста требований к продукту.

Материал для интервью

Это хороший каркас для ответа про качество, стоимость, задержку, защитные ограничения и эксплуатацию AI-системы целиком.

Источник

Книжный куб

Пост с обзором книги и всей серии выпусков про AI-инженерию.

Открыть пост

AI Engineering (AI-инженерия. Построение приложений с использованием базовых моделей)

Авторы: Chip Huyen
Издательство: O'Reilly Media, Inc.
Объём: 534 страниц

Chip Huyen о том, как строить AI-приложения вокруг базовых моделей: проектирование запросов, RAG, агенты, дообучение, оценивание и эксплуатация.

Оригинал
Перевод

Стек AI-инженерии по Chip Huyen

Базовые модели

GPT-4, Claude, Gemini, Llama: выбор модели и понимание её сильных и слабых сторон

Запрос и контекст

Проектирование запросов, примеры в контексте, пошаговые рассуждения и системные инструкции

RAG и слой знаний

RAG-архитектура, векторные хранилища и векторные представления

Агенты и инструменты

Агентные сценарии, вызов функций и оркестрация

Дообучение и адаптация

SFT, RLHF, LoRA и проектирование обучающих наборов

Связанная глава

Hands-On Large Language Models

Визуальное введение в LLM: токенизация, векторные представления и трансформеры

Читать обзор

Ключевые идеи книги

AI Engineering — не то же самое, что ML Engineering

Появление моделей как сервиса снизило порог входа. AI Engineering — это построение приложений вокруг , а не обучение моделей с нуля.

Оценивание — центральная тема

Чем глубже AI встроен в продукт, тем дороже ошибки. Поэтому системная проверка, автоматизированное оценивание с помощью другой модели и продуктовые метрики здесь обязательны.

От простого к сложному

Рабочая рамка проста: начни с проектирования запросов, добавляй RAG при необходимости, а к дообучению переходи только тогда, когда это действительно оправдано.

Рабочие ограничения

, стоимость вывода модели, устойчивость и мягкая деградация сервиса — это не второстепенные детали, а основа доставки и эксплуатации интеллектуальных функций продукта.

Связанная глава

ML System Design

Практическое руководство по проектированию ML-систем для интервью

Читать обзор

Структура книги: 10 глав

Часть I: Основа

1

Introduction to Building AI Applications

Переход от ML к генеративному AI, преимущества базовых моделей, токены, мультимодальность, типовые сценарии и AI как платформа.

2

Understanding Foundation Models

Данные и языки, трансформеры и механизм внимания, параметры и контекстное окно, этап дообучения после основной тренировки и галлюцинации.

Часть II: Разработка AI-приложений

3

Evaluation Methodology

Почему оценивание AI сложно, энтропия и перплексия, функциональная и нефункциональная корректность.

4

Evaluate AI Systems

Оценивание с помощью другой модели, попарные сравнения, бенчмарки и их ограничения, человеческая базовая линия и продуктовая валидация.

5

Prompt Engineering

Структура запросов, примеры в контексте, пошаговые рассуждения, системные промпты и демократизация разработки.

6

RAG and Agents

Архитектура RAG, векторные хранилища, стратегии разбиения на чанки, агенты и вызов функций.

7

Finetuning

Когда дообучение оправдано, SFT и RLHF, проектирование обучающих наборов, LoRA и эффективная адаптация.

Часть III: AI Engineering в эксплуатации

8

Dataset Engineering

Сбор и подготовка данных, разметка, синтетические данные и контур улучшения данных.

9

Inference Optimization

Задержка и пропускная способность, квантование, пакетирование, кеширование и оптимизация стоимости.

10

AI Engineering Architecture and User Feedback

Архитектура AI-приложений, сбор обратной связи, непрерывные улучшения и операционный контур для GenAI.

Оценивание: ключевая тема книги

Chip Huyen делает оценивание качества центральной темой AI Engineering. Две полные главы посвящены методологии и практике оценки:

Метрики

Перплексия, BLEU, ROUGE, семантическое сходство и метрики под конкретную задачу

Оценивание моделью

Одна модель оценивает ответы другой: как устроить судейство, где возникают смещения и зачем нужна калибровка

Проверка в продукте

A/B-тесты, обратная связь от пользователей, согласование с бизнес-метриками

Серия подкастов по главам

Книгу разбирают Александр Поломодов (CTO Т-Банка) и Евгений Сергеев (Engineering Director, Flo).

Выпуск #1

Preface & Intro Chapter

  • Обзор книги и структура из 10 глав
  • Переход от ML к GenAI
  • Токены и мультимодальность
  • Проектирование запросов и демократизация
  • Интеграция MCP и Claude Desktop

Выпуск #2

Understanding Foundation Models

  • Стадии обучения моделей
  • Трансформеры и механизм внимания
  • Параметры и контекстное окно
  • Этап дообучения: SFT и RLHF
  • Галлюцинации и их причины

Выпуск #3

Evaluation (Ch. 3–4)

  • Почему оценка AI сложна
  • Энтропия и перплексия
  • Оценивание моделью
  • Попарные сравнения моделей
  • Проверка в продукте

Связанные главы

Где найти книгу

Чтобы отмечать прохождение, включи трекинг в Настройки