System Design Space

    Глава 174

    Обновлено: 9 февраля 2026 г. в 20:31

    AI Engineering (short summary)

    Прогресс части0/16

    Источник

    Книжный куб

    Пост с обзором серии про AI Engineering.

    Открыть пост

    AI Engineering (AI-инженерия. Построение приложений с использованием базовых моделей)

    Авторы: Chip Huyen
    Издательство: O'Reilly Media, Inc.
    Объём: 534 страниц

    Chip Huyen о создании AI-приложений: foundation models, prompting, RAG, agents, finetuning, оценка качества и production-практики.

    AI Engineering — оригинальная обложкаОригинал
    AI-инженерия. Построение приложений с использованием базовых моделей — переводПеревод

    AI-стек по Chip Huyen

    Foundation Models

    GPT-4, Claude, Gemini, Llama — выбор и понимание возможностей

    Prompting & Context

    Prompt engineering, few-shot, chain-of-thought, system prompts

    RAG & Knowledge

    Retrieval-Augmented Generation, vector stores, embeddings

    Agents & Tools

    Автономные агенты, function calling, orchestration

    Finetuning & Adaptation

    SFT, RLHF, LoRA, dataset engineering

    Связанная глава

    Hands-On Large Language Models

    Визуальное введение в LLM: токенизация, эмбеддинги, трансформеры

    Читать обзор

    Ключевые идеи книги

    AI engineering ≠ ML engineering

    Model-as-a-service снизил порог входа. AI engineering — это построение приложений на базе foundation models, а не обучение моделей с нуля.

    Evaluation — центральная тема

    Чем глубже AI встроен в продукт, тем выше риск ошибок. Системная валидация, AI-as-a-judge и продуктовые метрики — must have.

    От простого к сложному

    Фреймворк разработки: начинай с prompting, добавляй RAG при необходимости, переходи к finetuning только когда это оправдано.

    Production concerns

    Latency, стоимость inference, устойчивость и graceful degradation — практики доставки и эксплуатации AI-фич.

    Связанная глава

    ML System Design

    Практическое руководство по проектированию ML-систем для интервью

    Читать обзор

    Структура книги: 10 глав

    Part I: Foundation

    1

    Introduction to Building AI Applications

    Переход от ML к GenAI, преимущества foundation models, токены и мультимодальность, use cases и AI как платформа.

    2

    Understanding Foundation Models

    Данные и языки, трансформеры и механизм внимания, параметры и контекстное окно, post-training (SFT, RLHF), галлюцинации.

    Part II: AI Application Development

    3

    Evaluation Methodology

    Почему оценка AI сложна, энтропия и перплексия, функциональная vs нефункциональная корректность.

    4

    Evaluate AI Systems

    AI-as-a-judge, попарные сравнения, бенчмарки и их ограничения, human baseline, продуктовая валидация.

    5

    Prompt Engineering

    Структура промптов, few-shot learning, chain-of-thought, system prompts и демократизация разработки.

    6

    RAG and Agents

    Retrieval-Augmented Generation, vector stores, chunking strategies, агенты и function calling.

    7

    Finetuning

    Когда finetuning оправдан, SFT vs RLHF, dataset engineering, LoRA и эффективная адаптация.

    Part III: AI Engineering in Production

    8

    Dataset Engineering

    Сбор и подготовка данных, аннотирование, синтетические данные, data flywheel.

    9

    Inference Optimization

    Latency и throughput, quantization, batching, caching, cost optimization.

    10

    AI Engineering Architecture and User Feedback

    Архитектура AI-приложений, сбор feedback, continuous improvement, MLOps для GenAI.

    Evaluation: ключевая тема книги

    Chip Huyen выделяет оценку качества как центральную проблему AI engineering. Две полные главы посвящены методологии и практикам:

    Метрики

    Перплексия, BLEU, ROUGE, semantic similarity, task-specific metrics

    AI-as-a-Judge

    LLM оценивает LLM: промпты для судейства, bias и калибровка

    Product Validation

    A/B тесты, user feedback, business metrics alignment

    Серия подкастов по главам

    Разбор книги ведут Александр Поломодов (CTO Т-Банка) и Евгений Сергеев (Engineering Director, Flo).

    Выпуск #1

    Preface & Intro Chapter

    • Обзор книги и структура из 10 глав
    • Переход от ML к GenAI
    • Токены и мультимодальность
    • Prompt engineering и демократизация
    • Интеграция MCP и Claude Desktop

    Выпуск #2

    Understanding Foundation Models

    • Стадии обучения моделей
    • Трансформеры и механизм внимания
    • Параметры и контекстное окно
    • Post-training: SFT и RLHF
    • Галлюцинации и их причины

    Выпуск #3

    Evaluation (Ch. 3–4)

    • Почему оценка AI сложна
    • Энтропия и перплексия
    • AI as a judge
    • Попарные сравнения моделей
    • Продуктовая валидация

    Где найти книгу