Для текущей инфры на 45.139.78.76 (prod) - MVP такой:
- Развернуть и настройть в докере сначала для DEV окружения
- Prometheus
- Grafana + 3 dashboards (- The Four Golden Signals, - RabbitMQ-Overview, - PostgreSQL Database)
- Cadvisor (монитроинг контейнеров)
Оценка (1 день)
- Настроить сбор и экспорт метрик Node Exporter (для CPU, memory, disc, network)
Оценка (5 часа)
- Настроить сбор и экспорт метрик Rabbitmq-exporter (для брокера)
Оценка (4 часа)
- Настроить сбор и экспорт метрик Postgres_exporte (для базы)
Оценка (4 часа)
- Grafana Loki и Promtail для Сбора и индексирования логов
- Для RabbitMQ: логи о создании/удалении очередей, ошибки подключения клиентов
- Для PostgreSQL: медленные запросы (если включено логирование), ошибки deadlock.
- NestJS: Тексты ошибок, stack traces, логи бизнес-процессов (User with id 123 created), предупреждения.
- Redis: Логи об исчерпании памяти, предупреждения о конфигурации. Оценка (2 дня и 5 часов)
- Собираем, тестим метрики, фиксим конфиги на DEV окружении
Оценка (2 дня)
- Деплоим на prod, тест и hotfixes
Оценка (1 день)
========================= Общая оценка: 8 дней Цена: (в личку)
Что нужно мне для имплементации:
- доступы на DEV окружение
- может есть где схема текущей инфраструтктуры ?
GIT repo пермиссии уже есть