Rivalry2

HTML Diff

1 added 1 removed

Original 2026-01-01

Modified 2026-02-19

1 - Кирилл Борисов, автор канала "Путь SRE". подготовил чек-лист "жёстких навыков", необходимых для работы SRE.

1 + Кирилл Борисов, автор канала "Путь SRE", подготовил чек-лист "жёстких навыков", необходимых для работы SRE.

2 1️⃣ Знания в области системного администрирования и инфраструктуры

3 <ul><li>Сетевые технологии:</li>

4 <li>Понимание того, как работают протоколы, маршрутизация, балансировка нагрузки и другие сетевые элементы, - это основа для успешного мониторинга и масштабирования систем.</li>

5 <li>Работа с серверной инфраструктурой:</li>

6 <li>Знания по настройке и поддержке операционных систем (особенно Linux), управления ресурсами, работы с файловыми системами и системами хранения данных.</li>

7 </ul>2️⃣ Опыт работы с контейнерами и оркестрацией

8 <ul><li>Docker & Kubernetes:</li>

9 <li>Понимание основ контейнеризации и опыт работы с инструментами для оркестрации контейнеров. Kubernetes - это практически стандарт для большинства SRE-команд, и знание его принципов является обязательным.</li>

10 <li>Helm:</li>

11 <li>Знание Helm для упрощения управления приложениями на Kubernetes и автоматизации процессов деплоя.</li>

12 </ul>3️⃣ Знания по автоматизации и инфраструктуре как код

13 <ul><li>Terraform, CloudFormation, Ansible:</li>

14 <li>Опыт написания инфраструктуры как код (IaC), автоматизация процессов развертывания и конфигурации.</li>

15 <li>CI/CD:</li>

16 <li>Навыки настройки и поддержки процессов непрерывной интеграции и доставки с использованием таких инструментов как Jenkins, GitLab CI или CircleCI. Это ключевое для достижения быстрого и безопасного деплоя.</li>

17 </ul>4️⃣ Системы мониторинга и алерты

18 <ul><li>Prometheus & Grafana:</li>

19 <li>Навыки мониторинга инфраструктуры с использованием таких инструментов, как Prometheus (для сбора метрик) и Grafana (для визуализации). Умение настраивать алерты для своевременного реагирования на инциденты.</li>

20 <li>ELK Stack (Elasticsearch, Logstash, Kibana):</li>

21 <li>Умение работать с логами и проводить анализ с помощью инструментов из ELK стека.</li>

22 </ul>Как построить нормальный мониторинг и перестать гадать на кофейной гуще - читайте<a>тут.</a>

23 5️⃣ Навыки в области высоконадежных систем

24 <ul><li>High Availability (HA) и Fault Tolerance:</li>

25 <li>Умение проектировать и поддерживать отказоустойчивые системы. Понимание принципов избыточности, автоматического восстановления и распределенных систем.</li>

26 <li>Disaster Recovery:</li>

27 <li>Опыт планирования и внедрения стратегий восстановления данных и сервисов после катастроф. Важно уметь быстро восстанавливать систему после сбоев.</li>

28 </ul>6️⃣ Разработка и скриптование

29 <ul><li>Python, Go, Bash:</li>

30 <li>Знание языков программирования, таких как Python и Go, для автоматизации задач и решения проблем, а также уверенное владение Bash для написания скриптов для обработки данных и выполнения команд.</li>

31 <li>CI/CD скрипты:</li>

32 <li>Опыт написания скриптов для автоматизации деплоя, тестирования и мониторинга.</li>

33 </ul>7️⃣ Разработка системы безопасности и защита данных

34 <ul><li>Security Best Practices:</li>

35 <li>Понимание принципов безопасной разработки и администрирования, включая управление доступом, шифрование данных и управление уязвимостями.</li>

36 <li>OAuth, OpenID, и другие протоколы аутентификации:</li>

37 <li>Опыт работы с системами аутентификации и защиты данных.</li>

38 </ul>8️⃣ Набор инструментов для работы с инцидентами

39 <ul><li>PagerDuty, Opsgenie, VictorOps:</li>

40 <li>Опыт использования платформ для управления инцидентами и уведомлений, включая настройку и обработку алертов.</li>

41 <li>Root Cause Analysis (RCA):</li>

42 <li>Умение проводить анализ корневой причины для изучения инцидентов и внедрения мер по предотвращению их повторений.</li>

43 </ul>Некоторые из этих навыков можно освоить на курсе "SRE: Observability".

44 Изучить программу и занять место на курсе -<a>по ссылке.</a>

45 Больше полезных материалов - в канале<a>"Путь SRE".</a>