System Design Space
Граф знанийНастройки

Обновлено: 2 мая 2026 г. в 10:22

Краткий обзор платформы данных Т-Банка

сложный

Эволюция платформы данных Т-Банка: путь от DWH к lakehouse-хранилищу, контуры приёма, хранения, обработки и управления данными, масштаб и операционные уроки.

Эта глава ценна тем, что даёт не абстрактную платформу данных, а живой эволюционный кейс: как большая компания проходит путь от DWH-подхода к lakehouse-хранилищу и платформенной модели без одного магического прыжка.

В реальной инженерной работе она помогает видеть платформу как последовательность управляемых шагов: что централизовать, что оставить доменам, как пережить миграционный долг и где проходит граница между общей платформенной возможностью и локальной свободой команды.

На интервью и архитектурных обсуждениях она особенно полезна там, где нужно говорить не только о целевом состоянии, но и о цене перехода: разделении зон ответственности, управлении изменениями и накопленном архитектурном долге.

Практическая польза главы

Практика проектирования

Показывает эволюцию платформы данных как последовательность управляемых архитектурных шагов.

Качество решений

Даёт ориентиры, когда централизовать платформенную возможность, а когда оставить доменный контур автономным.

Аргументация на интервью

Усиливает ответы реальным производственным примером операционной модели платформы и её ограничений.

Риски и компромиссы

Фокусирует на стоимости трансформации: миграционном долге, разделении ответственности и управлении изменениями.

Источник

Платформа данных Т-Банка

Разбор эволюции платформы, текущего ландшафта систем и ключевых архитектурных контуров.

Читать статью

В этой главе рассматривается как общий путь от источников к потребителям: , , , , и должны работать как единый . Отдельное внимание здесь получают , , и .

Краткий обзор платформы данных Т-Банка показывает, как архитектура эволюционирует при росте компании: от классического DWH-подхода (Inmon/Kimball) к озеру данных и . На масштабе 17k+ пользователей и 144M+ запросов в месяц платформа превращается в набор специализированных слоёв с явными зонами ответственности.

Масштаб платформы

Период эволюции

18+ лет

Переход от классического DWH к озеру данных и дальше к lakehouse-хранилищу.

Пользователи платформы

17 000+

Инженеры, аналитики и продуктовые команды работают через общий контур данных.

Запросы в месяц

144 млн+

Высокая нагрузка требует постоянной работы над масштабируемостью и задержкой.

Ключевые системы

19

Сквозной жизненный цикл: приём данных, хранение, обработка, управление, наблюдаемость и безопасность.

Архитектурные блоки платформы

Приём и доставка данных

Контур приёма и репликации соединяет OLTP-системы, потоки событий и потребительские дата-продукты.

Data Replication: BODS + Chrono

Исторический пакетный контур и современная потоковая репликация для стабильной доставки изменений.

Event Sourcing: SDP

Платформа потоковой передачи данных, построенная с учётом принципов Data Mesh для доменных событий.

Reverse ETL: Spheradian

Обратная загрузка обогащённых данных в операционные системы с задержкой до 100 мс.

Архитектурные выводы

На масштабе платформы данных не работает одна универсальная СУБД: нужны специализированные контуры хранения и вычислений под разные профили задержки и пропускной способности.

Контракты на данные и наблюдаемость становятся критичными: без них рост числа команд превращает платформу в неуправляемый набор интеграций.

Обратная загрузка данных закрывает разрыв между аналитикой и операционными продуктами: обогащённые признаки должны быстро возвращаться в бизнес-процессы.

Устойчивость платформы обеспечивается не только технологиями, но и организационной ответственностью: явные владельцы, инцидент-процессы и единые стандарты поставки данных.

Практический чеклист

  • Разделяйте приём данных, хранение, обработку и управление как отдельные архитектурные слои с явными SLA/SLO.
  • Для каждого дата-продукта фиксируйте контракт, владельца и обратную совместимость при изменении схем.
  • Планируйте выполнение на нескольких движках заранее: оптимальный движок для пакетной, потоковой и исследовательской аналитики обычно разный.
  • Внедряйте управление инцидентами в данных как обязательный процесс, а не как практику после первого крупного сбоя.

Источники

Связанные главы

Чтобы отмечать прохождение, включи трекинг в Настройки