1 added
1 removed
Original
2026-01-01
Modified
2026-02-19
1
-
<p><strong>Кирилл Борисов, автор канала "Путь SRE". подготовил чек-лист "жёстких навыков", необходимых для работы SRE.</strong></p>
1
+
<p><strong>Кирилл Борисов, автор канала "Путь SRE", подготовил чек-лист "жёстких навыков", необходимых для работы SRE.</strong></p>
2
<p>1️⃣ Знания в области системного администрирования и инфраструктуры</p>
2
<p>1️⃣ Знания в области системного администрирования и инфраструктуры</p>
3
<ul><li>Сетевые технологии:</li>
3
<ul><li>Сетевые технологии:</li>
4
<li>Понимание того, как работают протоколы, маршрутизация, балансировка нагрузки и другие сетевые элементы, - это основа для успешного мониторинга и масштабирования систем.</li>
4
<li>Понимание того, как работают протоколы, маршрутизация, балансировка нагрузки и другие сетевые элементы, - это основа для успешного мониторинга и масштабирования систем.</li>
5
<li>Работа с серверной инфраструктурой:</li>
5
<li>Работа с серверной инфраструктурой:</li>
6
<li>Знания по настройке и поддержке операционных систем (особенно Linux), управления ресурсами, работы с файловыми системами и системами хранения данных.</li>
6
<li>Знания по настройке и поддержке операционных систем (особенно Linux), управления ресурсами, работы с файловыми системами и системами хранения данных.</li>
7
</ul><p>2️⃣ Опыт работы с контейнерами и оркестрацией</p>
7
</ul><p>2️⃣ Опыт работы с контейнерами и оркестрацией</p>
8
<ul><li>Docker & Kubernetes:</li>
8
<ul><li>Docker & Kubernetes:</li>
9
<li>Понимание основ контейнеризации и опыт работы с инструментами для оркестрации контейнеров. Kubernetes - это практически стандарт для большинства SRE-команд, и знание его принципов является обязательным.</li>
9
<li>Понимание основ контейнеризации и опыт работы с инструментами для оркестрации контейнеров. Kubernetes - это практически стандарт для большинства SRE-команд, и знание его принципов является обязательным.</li>
10
<li>Helm:</li>
10
<li>Helm:</li>
11
<li>Знание Helm для упрощения управления приложениями на Kubernetes и автоматизации процессов деплоя.</li>
11
<li>Знание Helm для упрощения управления приложениями на Kubernetes и автоматизации процессов деплоя.</li>
12
</ul><p>3️⃣ Знания по автоматизации и инфраструктуре как код</p>
12
</ul><p>3️⃣ Знания по автоматизации и инфраструктуре как код</p>
13
<ul><li>Terraform, CloudFormation, Ansible:</li>
13
<ul><li>Terraform, CloudFormation, Ansible:</li>
14
<li>Опыт написания инфраструктуры как код (IaC), автоматизация процессов развертывания и конфигурации.</li>
14
<li>Опыт написания инфраструктуры как код (IaC), автоматизация процессов развертывания и конфигурации.</li>
15
<li>CI/CD:</li>
15
<li>CI/CD:</li>
16
<li>Навыки настройки и поддержки процессов непрерывной интеграции и доставки с использованием таких инструментов как Jenkins, GitLab CI или CircleCI. Это ключевое для достижения быстрого и безопасного деплоя.</li>
16
<li>Навыки настройки и поддержки процессов непрерывной интеграции и доставки с использованием таких инструментов как Jenkins, GitLab CI или CircleCI. Это ключевое для достижения быстрого и безопасного деплоя.</li>
17
</ul><p>4️⃣ Системы мониторинга и алерты</p>
17
</ul><p>4️⃣ Системы мониторинга и алерты</p>
18
<ul><li>Prometheus & Grafana:</li>
18
<ul><li>Prometheus & Grafana:</li>
19
<li>Навыки мониторинга инфраструктуры с использованием таких инструментов, как Prometheus (для сбора метрик) и Grafana (для визуализации). Умение настраивать алерты для своевременного реагирования на инциденты.</li>
19
<li>Навыки мониторинга инфраструктуры с использованием таких инструментов, как Prometheus (для сбора метрик) и Grafana (для визуализации). Умение настраивать алерты для своевременного реагирования на инциденты.</li>
20
<li>ELK Stack (Elasticsearch, Logstash, Kibana):</li>
20
<li>ELK Stack (Elasticsearch, Logstash, Kibana):</li>
21
<li>Умение работать с логами и проводить анализ с помощью инструментов из ELK стека.</li>
21
<li>Умение работать с логами и проводить анализ с помощью инструментов из ELK стека.</li>
22
</ul><p>Как построить нормальный мониторинг и перестать гадать на кофейной гуще - читайте<a>тут.</a></p>
22
</ul><p>Как построить нормальный мониторинг и перестать гадать на кофейной гуще - читайте<a>тут.</a></p>
23
<p>5️⃣ Навыки в области высоконадежных систем</p>
23
<p>5️⃣ Навыки в области высоконадежных систем</p>
24
<ul><li>High Availability (HA) и Fault Tolerance:</li>
24
<ul><li>High Availability (HA) и Fault Tolerance:</li>
25
<li>Умение проектировать и поддерживать отказоустойчивые системы. Понимание принципов избыточности, автоматического восстановления и распределенных систем.</li>
25
<li>Умение проектировать и поддерживать отказоустойчивые системы. Понимание принципов избыточности, автоматического восстановления и распределенных систем.</li>
26
<li>Disaster Recovery:</li>
26
<li>Disaster Recovery:</li>
27
<li>Опыт планирования и внедрения стратегий восстановления данных и сервисов после катастроф. Важно уметь быстро восстанавливать систему после сбоев.</li>
27
<li>Опыт планирования и внедрения стратегий восстановления данных и сервисов после катастроф. Важно уметь быстро восстанавливать систему после сбоев.</li>
28
</ul><p>6️⃣ Разработка и скриптование</p>
28
</ul><p>6️⃣ Разработка и скриптование</p>
29
<ul><li>Python, Go, Bash:</li>
29
<ul><li>Python, Go, Bash:</li>
30
<li>Знание языков программирования, таких как Python и Go, для автоматизации задач и решения проблем, а также уверенное владение Bash для написания скриптов для обработки данных и выполнения команд.</li>
30
<li>Знание языков программирования, таких как Python и Go, для автоматизации задач и решения проблем, а также уверенное владение Bash для написания скриптов для обработки данных и выполнения команд.</li>
31
<li>CI/CD скрипты:</li>
31
<li>CI/CD скрипты:</li>
32
<li>Опыт написания скриптов для автоматизации деплоя, тестирования и мониторинга.</li>
32
<li>Опыт написания скриптов для автоматизации деплоя, тестирования и мониторинга.</li>
33
</ul><p>7️⃣ Разработка системы безопасности и защита данных</p>
33
</ul><p>7️⃣ Разработка системы безопасности и защита данных</p>
34
<ul><li>Security Best Practices:</li>
34
<ul><li>Security Best Practices:</li>
35
<li>Понимание принципов безопасной разработки и администрирования, включая управление доступом, шифрование данных и управление уязвимостями.</li>
35
<li>Понимание принципов безопасной разработки и администрирования, включая управление доступом, шифрование данных и управление уязвимостями.</li>
36
<li>OAuth, OpenID, и другие протоколы аутентификации:</li>
36
<li>OAuth, OpenID, и другие протоколы аутентификации:</li>
37
<li>Опыт работы с системами аутентификации и защиты данных.</li>
37
<li>Опыт работы с системами аутентификации и защиты данных.</li>
38
</ul><p>8️⃣ Набор инструментов для работы с инцидентами</p>
38
</ul><p>8️⃣ Набор инструментов для работы с инцидентами</p>
39
<ul><li>PagerDuty, Opsgenie, VictorOps:</li>
39
<ul><li>PagerDuty, Opsgenie, VictorOps:</li>
40
<li>Опыт использования платформ для управления инцидентами и уведомлений, включая настройку и обработку алертов.</li>
40
<li>Опыт использования платформ для управления инцидентами и уведомлений, включая настройку и обработку алертов.</li>
41
<li>Root Cause Analysis (RCA):</li>
41
<li>Root Cause Analysis (RCA):</li>
42
<li>Умение проводить анализ корневой причины для изучения инцидентов и внедрения мер по предотвращению их повторений.</li>
42
<li>Умение проводить анализ корневой причины для изучения инцидентов и внедрения мер по предотвращению их повторений.</li>
43
</ul><p>Некоторые из этих навыков можно освоить на курсе "SRE: Observability".</p>
43
</ul><p>Некоторые из этих навыков можно освоить на курсе "SRE: Observability".</p>
44
<p><strong>Изучить программу и занять место на курсе -<a>по ссылке.</a></strong></p>
44
<p><strong>Изучить программу и занять место на курсе -<a>по ссылке.</a></strong></p>
45
<p><strong>Больше полезных материалов - в канале<a>"Путь SRE".</a></strong></p>
45
<p><strong>Больше полезных материалов - в канале<a>"Путь SRE".</a></strong></p>