Форк сервиса LinkedIn OnCall для управлением дежурств, покрытый мониторингом. Домашние задания по курсу SRE в Тинькофф Академии
- Сбор метрик в Prometheus с docker service discovery
- Кастомный экспортер со сбором бизнес метрик (/monitoring/duty_exporter)
- Blackbox Exporter, Node exporter, CAdvisor
- Спроектированы и замониторены SLI, SLO, SLA
- Развернут и настроен стэк для сборки логов ELK
- Развернута Grafana, настроены дашборды, покрывающие SLI, SLO, SLA системы, RED и USE метрики, логи ( /monitoring/dashboards)
- Настроены алерты в телеграм
- Round Robin балансировка двух нод через nginx, покрытие его метриками
- Скрипт с бесшовным обновлением OnCall
| System Summary |
|---|
![]() |
| Oncall Dashboard |
![]() |
![]() |
![]() |
![]() |




