HTML Diff
1 added 1 removed
Original 2026-01-01
Modified 2026-02-19
1 - <p><strong>Кирилл Борисов, автор канала "Путь SRE". подготовил чек-лист "жёстких навыков", необходимых для работы SRE.</strong></p>
1 + <p><strong>Кирилл Борисов, автор канала "Путь SRE", подготовил чек-лист "жёстких навыков", необходимых для работы SRE.</strong></p>
2 <p>1️⃣ Знания в области системного администрирования и инфраструктуры</p>
2 <p>1️⃣ Знания в области системного администрирования и инфраструктуры</p>
3 <ul><li>Сетевые технологии:</li>
3 <ul><li>Сетевые технологии:</li>
4 <li>Понимание того, как работают протоколы, маршрутизация, балансировка нагрузки и другие сетевые элементы, - это основа для успешного мониторинга и масштабирования систем.</li>
4 <li>Понимание того, как работают протоколы, маршрутизация, балансировка нагрузки и другие сетевые элементы, - это основа для успешного мониторинга и масштабирования систем.</li>
5 <li>Работа с серверной инфраструктурой:</li>
5 <li>Работа с серверной инфраструктурой:</li>
6 <li>Знания по настройке и поддержке операционных систем (особенно Linux), управления ресурсами, работы с файловыми системами и системами хранения данных.</li>
6 <li>Знания по настройке и поддержке операционных систем (особенно Linux), управления ресурсами, работы с файловыми системами и системами хранения данных.</li>
7 </ul><p>2️⃣ Опыт работы с контейнерами и оркестрацией</p>
7 </ul><p>2️⃣ Опыт работы с контейнерами и оркестрацией</p>
8 <ul><li>Docker &amp; Kubernetes:</li>
8 <ul><li>Docker &amp; Kubernetes:</li>
9 <li>Понимание основ контейнеризации и опыт работы с инструментами для оркестрации контейнеров. Kubernetes - это практически стандарт для большинства SRE-команд, и знание его принципов является обязательным.</li>
9 <li>Понимание основ контейнеризации и опыт работы с инструментами для оркестрации контейнеров. Kubernetes - это практически стандарт для большинства SRE-команд, и знание его принципов является обязательным.</li>
10 <li>Helm:</li>
10 <li>Helm:</li>
11 <li>Знание Helm для упрощения управления приложениями на Kubernetes и автоматизации процессов деплоя.</li>
11 <li>Знание Helm для упрощения управления приложениями на Kubernetes и автоматизации процессов деплоя.</li>
12 </ul><p>3️⃣ Знания по автоматизации и инфраструктуре как код</p>
12 </ul><p>3️⃣ Знания по автоматизации и инфраструктуре как код</p>
13 <ul><li>Terraform, CloudFormation, Ansible:</li>
13 <ul><li>Terraform, CloudFormation, Ansible:</li>
14 <li>Опыт написания инфраструктуры как код (IaC), автоматизация процессов развертывания и конфигурации.</li>
14 <li>Опыт написания инфраструктуры как код (IaC), автоматизация процессов развертывания и конфигурации.</li>
15 <li>CI/CD:</li>
15 <li>CI/CD:</li>
16 <li>Навыки настройки и поддержки процессов непрерывной интеграции и доставки с использованием таких инструментов как Jenkins, GitLab CI или CircleCI. Это ключевое для достижения быстрого и безопасного деплоя.</li>
16 <li>Навыки настройки и поддержки процессов непрерывной интеграции и доставки с использованием таких инструментов как Jenkins, GitLab CI или CircleCI. Это ключевое для достижения быстрого и безопасного деплоя.</li>
17 </ul><p>4️⃣ Системы мониторинга и алерты</p>
17 </ul><p>4️⃣ Системы мониторинга и алерты</p>
18 <ul><li>Prometheus &amp; Grafana:</li>
18 <ul><li>Prometheus &amp; Grafana:</li>
19 <li>Навыки мониторинга инфраструктуры с использованием таких инструментов, как Prometheus (для сбора метрик) и Grafana (для визуализации). Умение настраивать алерты для своевременного реагирования на инциденты.</li>
19 <li>Навыки мониторинга инфраструктуры с использованием таких инструментов, как Prometheus (для сбора метрик) и Grafana (для визуализации). Умение настраивать алерты для своевременного реагирования на инциденты.</li>
20 <li>ELK Stack (Elasticsearch, Logstash, Kibana):</li>
20 <li>ELK Stack (Elasticsearch, Logstash, Kibana):</li>
21 <li>Умение работать с логами и проводить анализ с помощью инструментов из ELK стека.</li>
21 <li>Умение работать с логами и проводить анализ с помощью инструментов из ELK стека.</li>
22 </ul><p>Как построить нормальный мониторинг и перестать гадать на кофейной гуще - читайте<a>тут.</a></p>
22 </ul><p>Как построить нормальный мониторинг и перестать гадать на кофейной гуще - читайте<a>тут.</a></p>
23 <p>5️⃣ Навыки в области высоконадежных систем</p>
23 <p>5️⃣ Навыки в области высоконадежных систем</p>
24 <ul><li>High Availability (HA) и Fault Tolerance:</li>
24 <ul><li>High Availability (HA) и Fault Tolerance:</li>
25 <li>Умение проектировать и поддерживать отказоустойчивые системы. Понимание принципов избыточности, автоматического восстановления и распределенных систем.</li>
25 <li>Умение проектировать и поддерживать отказоустойчивые системы. Понимание принципов избыточности, автоматического восстановления и распределенных систем.</li>
26 <li>Disaster Recovery:</li>
26 <li>Disaster Recovery:</li>
27 <li>Опыт планирования и внедрения стратегий восстановления данных и сервисов после катастроф. Важно уметь быстро восстанавливать систему после сбоев.</li>
27 <li>Опыт планирования и внедрения стратегий восстановления данных и сервисов после катастроф. Важно уметь быстро восстанавливать систему после сбоев.</li>
28 </ul><p>6️⃣ Разработка и скриптование</p>
28 </ul><p>6️⃣ Разработка и скриптование</p>
29 <ul><li>Python, Go, Bash:</li>
29 <ul><li>Python, Go, Bash:</li>
30 <li>Знание языков программирования, таких как Python и Go, для автоматизации задач и решения проблем, а также уверенное владение Bash для написания скриптов для обработки данных и выполнения команд.</li>
30 <li>Знание языков программирования, таких как Python и Go, для автоматизации задач и решения проблем, а также уверенное владение Bash для написания скриптов для обработки данных и выполнения команд.</li>
31 <li>CI/CD скрипты:</li>
31 <li>CI/CD скрипты:</li>
32 <li>Опыт написания скриптов для автоматизации деплоя, тестирования и мониторинга.</li>
32 <li>Опыт написания скриптов для автоматизации деплоя, тестирования и мониторинга.</li>
33 </ul><p>7️⃣ Разработка системы безопасности и защита данных</p>
33 </ul><p>7️⃣ Разработка системы безопасности и защита данных</p>
34 <ul><li>Security Best Practices:</li>
34 <ul><li>Security Best Practices:</li>
35 <li>Понимание принципов безопасной разработки и администрирования, включая управление доступом, шифрование данных и управление уязвимостями.</li>
35 <li>Понимание принципов безопасной разработки и администрирования, включая управление доступом, шифрование данных и управление уязвимостями.</li>
36 <li>OAuth, OpenID, и другие протоколы аутентификации:</li>
36 <li>OAuth, OpenID, и другие протоколы аутентификации:</li>
37 <li>Опыт работы с системами аутентификации и защиты данных.</li>
37 <li>Опыт работы с системами аутентификации и защиты данных.</li>
38 </ul><p>8️⃣ Набор инструментов для работы с инцидентами</p>
38 </ul><p>8️⃣ Набор инструментов для работы с инцидентами</p>
39 <ul><li>PagerDuty, Opsgenie, VictorOps:</li>
39 <ul><li>PagerDuty, Opsgenie, VictorOps:</li>
40 <li>Опыт использования платформ для управления инцидентами и уведомлений, включая настройку и обработку алертов.</li>
40 <li>Опыт использования платформ для управления инцидентами и уведомлений, включая настройку и обработку алертов.</li>
41 <li>Root Cause Analysis (RCA):</li>
41 <li>Root Cause Analysis (RCA):</li>
42 <li>Умение проводить анализ корневой причины для изучения инцидентов и внедрения мер по предотвращению их повторений.</li>
42 <li>Умение проводить анализ корневой причины для изучения инцидентов и внедрения мер по предотвращению их повторений.</li>
43 </ul><p>Некоторые из этих навыков можно освоить на курсе "SRE: Observability".</p>
43 </ul><p>Некоторые из этих навыков можно освоить на курсе "SRE: Observability".</p>
44 <p><strong>Изучить программу и занять место на курсе -<a>по ссылке.</a></strong></p>
44 <p><strong>Изучить программу и занять место на курсе -<a>по ссылке.</a></strong></p>
45 <p><strong>Больше полезных материалов - в канале<a>"Путь SRE".</a></strong></p>
45 <p><strong>Больше полезных материалов - в канале<a>"Путь SRE".</a></strong></p>