Глава 101. Data platforms: Как их строить в 2025 году - интервью с Николаем Головым

Interview with Nikolay Golov about data platforms - YouTube cover

Research Insights Made Simple #6: Interview with Nikolay Golov about data platforms

Выпуск о том, как проектировать и развивать data platform в 2025 году: от федерализации и data products до ограничений OLTP/MPP и эволюции cloud analytics.

Год:2025

Production:Research Insights Made Simple

Источник

Telegram: book_cube

Оригинальный пост с анонсом выпуска и краткими тезисами.

Читать пост

О выпуске

Это интервью продолжает серию Research Insights Made Simple и фокусируется на практической эволюции data platform. В разговоре разбираются реальные инженерные компромиссы: как сочетать централизацию и автономию команд, как не утонуть в цепочках дата-продуктов и почему архитектурные ограничения старых подходов все сильнее заметны в 2025 году.

Гость и регалии

Николай Голов

Head of Data Engineering в ManyChat.
Ex Head of Data Platform в Авито.
Практик по построению OLTP/OLAP систем и преподаватель баз данных.

Формат выпуска: интервью в рамках рубрики #Data.

Ключевые темы разговора

Карьерный путь гостя

Как Николай Голов развивался в разных компаниях и параллельно преподавал базы данных.

Модели организации платформы

Централизованный, гибридный и децентрализованный подходы к развитию data platform.

Data Mesh в теории и на практике

Почему принципы федерализации полезны, но в реальности часто превращаются в data mash.

Подходы по масштабу компании

Отличия проектирования платформы в стартапах, средних и крупных компаниях в 2025 году.

Ограничения классических OLTP СУБД

Где Postgres и похожие системы упираются в нагрузку, стоимость и архитектурные компромиссы.

Ограничения MPP-решений

Когда Vertica, Greenplum и ClickHouse не решают задачу целиком и требуют дополнительных слоев.

Цепочки data products

Почему важно выделять базовый домен данных, чтобы укорачивать зависимые продуктовые цепочки.

Почему cloud DW так быстры

Колоночное хранение и разделение storage/compute как база современной аналитической скорости.

Medallion architecture

Практическая схема Bronze/Silver/Gold как способ стандартизировать путь данных внутри платформы.

Связанная тема

Специфика проектирования data-систем

Глава с Medallion, data-потоками и системными trade-offs.

Открыть главу

Практические выводы на 2025 год

Не существует универсальной организационной модели data platform: структура зависит от стадии компании и доменных границ.
Data mesh полезен как направление, но без четкого platform layer и governance он быстро деградирует.
OLTP и MPP системы нужны, но в одиночку не покрывают end-to-end сценарии аналитики и data products.
Ключевая инженерная ставка в 2025 году: разделение storage/compute, открытые форматы и сильная self-service платформа.
Главная цель платформы: уменьшать time-to-data для продуктовых команд, не теряя контроль качества и стоимости.

Отсылки на материалы

YouTube

Полная видеоверсия интервью.

Telegram пост

Краткое саммари и анонс выпуска.

Ya Music

Аудиоверсия подкаста.

Podster.fm

Альтернативная аудиоплощадка.

Для углубления по смежным темам: Введение в хранение данных, DDIA, Streaming Data, Big Data, Learning DDD (включая Data Mesh).