Мониторинг: Prometheus, Grafana и SRE-практики

Изучи мониторинг: Prometheus, PromQL, Grafana, Loki, Tempo, Alertmanager, OpenTelemetry. SRE-практики, SLI/SLO, production-мониторинг Kubernetes.

Курс включает 8 модулей и 600+ упражнений с мгновенной проверкой.

Темы курса

  • SRE и SLI/SLO
  • Prometheus
  • PromQL
  • Grafana
  • Observability
  • Alerting
  • Production

Часто задаваемые вопросы

Что изучается в курсе Мониторинг?

Курс охватывает SRE-практики (SLI/SLO/error budgets), Prometheus, PromQL, Grafana, observability (Loki, Tempo, OpenTelemetry), алертинг и production-мониторинг Kubernetes.

Нужен ли опыт с Kubernetes для курса?

Базовые знания Docker и Kubernetes помогут, но многие концепции объясняются с нуля. Рекомендуем сначала пройти курсы Docker и Kubernetes.

Что такое SLO и error budget?

SLO — целевой уровень надёжности сервиса (например, 99.9% доступности). Error budget — допустимый объём сбоев: для 99.9% SLO это 43 минуты простоя в месяц.