Граф знанийНастройки

Обновлено: 24 марта 2026 г. в 15:23

Prometheus: The Documentary

medium

История Prometheus: SoundCloud, PromQL и путь к стандарту для cloud-native мониторинга.

История Prometheus интересна не ностальгией, а тем, как одна модель мониторинга сумела совпасть с устройством cloud-native систем.

Путь от SoundCloud до индустриального стандарта показывает, почему pull-based scraping, PromQL и многомерные time series оказались достаточно практичными для платформенных команд и SRE-процессов.

Для инженерных обсуждений фильм полезен как контекст к вопросам о tooling adoption, standardization pressure и том, как выбор observability stack влияет на операционный язык всей организации.

Практическая польза главы

Практика проектирования

Переводите знания о истории Prometheus и роли метрик в cloud-native reliability в конкретные эксплуатационные решения: интерфейсы алертинга, runbook-границы и rollback-стратегии.

Качество решений

Оценивайте архитектуру через SLO, error budget, MTTR и устойчивость critical-path, а не только через функциональную полноту.

Interview articulation

Структурируйте ответ вокруг reliability lifecycle: сигнал деградации, реакция, локализация причины, восстановление и профилактика повторов.

Trade-off framing

Явно фиксируйте компромиссы по истории Prometheus и роли метрик в cloud-native reliability: скорость релизов, уровень автоматизации, стоимость observability и операционная сложность.

Prometheus: The Documentary

История мониторинга, ставшего стандартом для cloud-native экосистемы

Год:2022
Производство:не указано

Источник

Книжный куб

Оригинальный пост с рекомендацией документального фильма

Перейти на сайт

О чем фильм

Документальный фильм показывает, как Prometheus родился внутри SoundCloud в 2012 году и стал стандартом де-факто для мониторинга cloud-native приложений. История начинается с проблем надежности и сложности наблюдаемости за собственным оркестратором рабочих нагрузок.

Как развивалась история

2012

SoundCloud и SRE-боль

Два ex-googlers (Julius Volz, Bjorn Rabenstein) отвечали за надежность SoundCloud. Внутри уже был свой оркестратор рабочих нагрузок (до появления Kubernetes).

2012

Неудачные попытки с statsd и graphite

Мониторить кластер этими инструментами оказалось слишком тяжело, поэтому инженеры начали делать систему, похожую на мониторинг Borg в Google.

2012-2013

Рождение Prometheus

Новый подход: pull-модель сбора, time-series база и PromQL для запросов.

2015

Open source и анонс

Код сразу публикуется на GitHub, затем SoundCloud официально анонсирует систему и ее подхватывает другая компания как early-adopter.

2016

Вход в CNCF

Prometheus принимают в CNCF как второй hosted/incubating проект после Kubernetes. Это закрепляет нейтральную governance-модель и ускоряет экосистемный рост.

2018

Graduated-статус в CNCF

Prometheus становится вторым graduated-проектом CNCF после Kubernetes. Для рынка это сигнал зрелости: стабильный governance, активное сообщество и production-ready профиль.

2022

Prometheus v2.40 и native histograms (эксперимент)

В релизе 2.40 появляется экспериментальная поддержка native histograms. Это важный шаг в сторону более точных метрик распределений при высокой нагрузке.

2024

Prometheus 3.0

Выходит мажорный релиз 3.0 (первый major за 7 лет): проект обновляет технический фундамент и продолжает эволюцию без потери роли стандарта cloud-native мониторинга.

2025+

Стабилизация 3.x

В ветке 3.x продолжается развитие; поддержка native histograms закрепляется как стабильная (начиная с v3.8), что упрощает использование в production-практике.

Ключевые технические идеи

Pull-модель

Система сама опрашивает цели, что упрощает масштабирование и снижает нагрузку на клиентов.

Time-series база

Оптимизация под метрики, временные ряды и высокую кардинальность.

PromQL

Гибкий язык запросов для агрегаций и вычислений поверх метрик.

Экосистема

Экспортеры, Alertmanager, Grafana и интеграции для Kubernetes.

Полезные ссылки

Связанные главы

  • Site Reliability Engineering - Даёт практики SLI/SLO и работы с инцидентами, где метрики Prometheus становятся операционным стандартом.
  • Kubernetes: The Documentary - Показывает становление cloud-native экосистемы, в которой Prometheus закрепился как базовый слой мониторинга.
  • Cloud Native - Связывает архитектуру платформ с observability-практиками и ролью метрик в эксплуатации распределённых систем.
  • Kubernetes Patterns - Дополняет тему операционными паттернами Kubernetes, где мониторинг и alerting встроены в повседневный delivery.
  • Building Microservices - Раскрывает практики наблюдаемости и метрик в микросервисах, для которых Prometheus часто становится базовым выбором.

Чтобы отмечать прохождение, включи трекинг в Настройки