Ежедневные проверки¶
Выполняется каждый рабочий день утром.
1. Серверы и доступность¶
- [ ] Все серверы в Hetzner Cloud в статусе Running
- [ ] SSH-доступ к ключевым узлам работает:
lb26,prodapp26,dbprod26,mon26 - [ ] Load balancer
lb26(168.119.247.232) отвечает
2. Мониторинг¶
- [ ] Открыть
mon26— нет активных критических алертов - [ ] Проверить дашборды за прошедшие 24 ч: нет аномалий по CPU, RAM, диску
- [ ] Нет пропущенных уведомлений в канале алертов
3. Резервные копии¶
- [ ] Бэкап за прошедшие сутки на
bkp26завершился успешно - [ ] Объём свободного места на
bkp26не критичен (> 20 %)
4. Базы данных¶
- [ ]
dbprod26доступна, репликация (если есть) без ошибок - [ ] Медленных запросов / ошибок подключения в логах нет
5. Диск и ресурсы¶
Быстрая проверка на продакшн-серверах:
Пороги тревоги: диск > 80 %, load average > числа ядер.
6. CI/CD¶
- [ ] Последние пайплайны в prod завершились успешно
- [ ] Нет зависших или отменённых деплоев
7. Счёт Hetzner¶
Раз в неделю (по понедельникам):
- [ ] Сумма текущего инвойса в разумных пределах (ориентир ≈ €1 230/мес)
- [ ] Нет неожиданных новых ресурсов
При обнаружении проблемы — создать инцидент и следовать соответствующему runbook.