Фундамент
Designing Data-Intensive Applications
База по моделям данных, репликации и транзакциям.
Хранение данных — это сердце любой системы. От выбора модели данных и типа базы зависит всё: скорость работы, надёжность, стоимость и способность масштабироваться. Эта часть помогает разобраться, какие хранилища существуют, как они устроены и где их применять.
Зачем разбираться в системах хранения
Архитектурные компромиссы
SQL, NoSQL, графы, wide-column — разные модели дают разные гарантии и ограничения.
Latency vs consistency
Репликация и транзакции влияют на задержки и устойчивость системы.
Масштабирование
Шардирование, партиции, индексы и кэширование задают пределы роста.
Стоимость владения
Разные СУБД требуют разной операционной нагрузки и затрат на поддержку.
Карта раздела: что изучаем
Хранилища и движки
PostgreSQL, MySQL, MongoDB, Cassandra и их архитектуры.
Надёжность данных
Репликация, транзакции, индексы, консистентность и сбои.
Что даст этот раздел на практике
- Быстрый выбор подходящей СУБД под задачу.
- Понимание компромиссов между моделью данных и доступностью.
- Умение проектировать схемы, индексы и стратегию хранения.
- Подготовку к System Design интервью с упором на storage.
Начать стоит с введения в хранение данных и путеводителя по базам данных.
