HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-19
1 <p>SRE - это не просто человек, который тушит пожары в проде. Это тот, кто строит системы так, чтобы пожаров было меньше. И для этого у него есть свой "набор выживальщика" - инструменты, которые помогают держать инфраструктуру под контролем.</p>
1 <p>SRE - это не просто человек, который тушит пожары в проде. Это тот, кто строит системы так, чтобы пожаров было меньше. И для этого у него есть свой "набор выживальщика" - инструменты, которые помогают держать инфраструктуру под контролем.</p>
2 <ul><li><strong>Мониторинг и алертинг</strong></li>
2 <ul><li><strong>Мониторинг и алертинг</strong></li>
3 </ul><p>- Prometheus + Grafana - классика. Метрики, дашборды, алерты. Без них вы как пилот без приборной панели.</p>
3 </ul><p>- Prometheus + Grafana - классика. Метрики, дашборды, алерты. Без них вы как пилот без приборной панели.</p>
4 <p>- VictoriaMetrics - альтернатива Prometheus, потребляет меньше ресурсов.</p>
4 <p>- VictoriaMetrics - альтернатива Prometheus, потребляет меньше ресурсов.</p>
5 <p>- Thanos / Mimir - для хранения исторических метрик и федерации Prometheus.</p>
5 <p>- Thanos / Mimir - для хранения исторических метрик и федерации Prometheus.</p>
6 <p>- Alertmanager - помогает не сойти с ума от 1000+ алертов в день.</p>
6 <p>- Alertmanager - помогает не сойти с ума от 1000+ алертов в день.</p>
7 <ul><li><strong>Управление инфраструктурой</strong></li>
7 <ul><li><strong>Управление инфраструктурой</strong></li>
8 </ul><p>- Terraform - инфраструктура как код, автоматизация всего и вся.</p>
8 </ul><p>- Terraform - инфраструктура как код, автоматизация всего и вся.</p>
9 <p>- Ansible - настройка серверов без боли и слёз.</p>
9 <p>- Ansible - настройка серверов без боли и слёз.</p>
10 <p>- Kubernetes (k8s) - сердце контейнеризированной инфраструктуры.</p>
10 <p>- Kubernetes (k8s) - сердце контейнеризированной инфраструктуры.</p>
11 <p>- Helm - пакетный менеджер для Kubernetes, без него деплои - ад.</p>
11 <p>- Helm - пакетный менеджер для Kubernetes, без него деплои - ад.</p>
12 <ul><li><strong>Логи и трассировка</strong></li>
12 <ul><li><strong>Логи и трассировка</strong></li>
13 </ul><p>- Loki + Grafana - быстрый модно-молодëжный лог-менеджер.</p>
13 </ul><p>- Loki + Grafana - быстрый модно-молодëжный лог-менеджер.</p>
14 <p>- ELK (Elasticsearch + Logstash + Kibana) - мощный стек для логов, но может потреблять ресурсы как ненасытный демон.</p>
14 <p>- ELK (Elasticsearch + Logstash + Kibana) - мощный стек для логов, но может потреблять ресурсы как ненасытный демон.</p>
15 <p>- Jaeger / OpenTelemetry - трассировка запросов, чтобы понимать, где сервисы тормозят.</p>
15 <p>- Jaeger / OpenTelemetry - трассировка запросов, чтобы понимать, где сервисы тормозят.</p>
16 <ul><li><strong>Управление трафиком и отказоустойчивость</strong></li>
16 <ul><li><strong>Управление трафиком и отказоустойчивость</strong></li>
17 </ul><p>- NGINX / Envoy / Traefik - балансировка нагрузки и маршрутизация запросов.</p>
17 </ul><p>- NGINX / Envoy / Traefik - балансировка нагрузки и маршрутизация запросов.</p>
18 <p>- Istio / Linkerd - сервис-меши для сложных микросервисных систем.</p>
18 <p>- Istio / Linkerd - сервис-меши для сложных микросервисных систем.</p>
19 <p>- Litmus / Gremlin - chaos engineering, искусственное создание сбоев, чтобы быть готовым к реальным.</p>
19 <p>- Litmus / Gremlin - chaos engineering, искусственное создание сбоев, чтобы быть готовым к реальным.</p>
20 <ul><li><strong>Безопасность и управление доступом</strong></li>
20 <ul><li><strong>Безопасность и управление доступом</strong></li>
21 </ul><p>- Vault - защищённое хранение секретов (пароли, API-ключи).</p>
21 </ul><p>- Vault - защищённое хранение секретов (пароли, API-ключи).</p>
22 <p>- Keycloak / Auth0 - управление аутентификацией и авторизацией.</p>
22 <p>- Keycloak / Auth0 - управление аутентификацией и авторизацией.</p>
23 <p>- Falco - мониторинг безопасности в Kubernetes.</p>
23 <p>- Falco - мониторинг безопасности в Kubernetes.</p>
24 <ul><li><strong>Автоматизация и CI/CD</strong></li>
24 <ul><li><strong>Автоматизация и CI/CD</strong></li>
25 </ul><p>- GitHub Actions / GitLab CI / Jenkins / ArgoCD - автоматические пайплайны деплоя.</p>
25 </ul><p>- GitHub Actions / GitLab CI / Jenkins / ArgoCD - автоматические пайплайны деплоя.</p>
26 <p>- FluxCD / ArgoCD - GitOps-подход к управлению инфраструктурой.</p>
26 <p>- FluxCD / ArgoCD - GitOps-подход к управлению инфраструктурой.</p>
27 <p>Конечно, вам не придется работать со всеми инструментами сразу в одном проекте. Но чем больше инструментов вы освоите, тем проще вам строить надёжные, самовосстанавливающиеся системы.</p>
27 <p>Конечно, вам не придется работать со всеми инструментами сразу в одном проекте. Но чем больше инструментов вы освоите, тем проще вам строить надёжные, самовосстанавливающиеся системы.</p>
28 <p><strong>Подробнее объясняем на курсе:<a>"SRE: data-driven подход к управлению надёжностью систем".</a></strong>Познакомиться с программой и условиями можно<a>по ссылке.</a></p>
28 <p><strong>Подробнее объясняем на курсе:<a>"SRE: data-driven подход к управлению надёжностью систем".</a></strong>Познакомиться с программой и условиями можно<a>по ссылке.</a></p>