Изучи мониторинг: Prometheus, PromQL, Grafana, Loki, Tempo, Alertmanager, OpenTelemetry. SRE-практики, SLI/SLO, production-мониторинг Kubernetes.
Курс включает 8 модулей и 600+ упражнений с мгновенной проверкой.
Курс охватывает SRE-практики (SLI/SLO/error budgets), Prometheus, PromQL, Grafana, observability (Loki, Tempo, OpenTelemetry), алертинг и production-мониторинг Kubernetes.
Базовые знания Docker и Kubernetes помогут, но многие концепции объясняются с нуля. Рекомендуем сначала пройти курсы Docker и Kubernetes.
SLO — целевой уровень надёжности сервиса (например, 99.9% доступности). Error budget — допустимый объём сбоев: для 99.9% SLO это 43 минуты простоя в месяц.