SRE (Site Reliability Engineering): обучающий онлайн-курс для специалистов и бизнеса, курс по SRE на платформе Слёрм
2026-02-19 18:16 Diff
https://slurm.io/sre
  • Закройте пробелы в SRE и почувствуйте уверенность в своих скиллах
  • Внедрите SRE-практики в команду и избавьтесь от хаоса с инцидентами

Видеокурс «Мониторинг в Grafanа» в подарок!

поделим на группы, распределим роли и научим работать в коллективе

решайте задачи и кейсы, которые возникают на вашем сервисе

Прямое общение со спикерами

разборы кейсов, Q&A и отдельный чат

Начинающие DevOps, младшие сисадмины, разработчики, которые присматриваются к SRE

DevOps, SRE, тимлиды инфраструктурных команд, архитекторы, сисадмины, разработчики с «инфра-ответственностью»

Вы хотите познакомиться с SRE, понять, что это такое и зачем оно вам нужно, а также получить фреймворки для старта в новой сфере

Вы устали «тушить пожары» и хотите внедрить метрики, алерты и постмортемы в команду, а также систематизировать свои знания по SRE

Получите готовый план внедрения SRE, сможете рассчитать ROI и обосновать его руководству

Сделаете первые шаги в SRE, получите полезные чек-листы и шаблоны, которые сразу сможете внедрить в работу

DevOps/SRE инженеры уровня middle/middle+ и разработчики, которые хотят сделать апгрейд в SRE

Вы хотите закрыть пробелы в знаниях, сделать крупный шаг в карьере или избавиться от «синдрома самозванца»

Прокачаете ваши скиллы, повысите экспертизу в SRE и станете увереннее как специалист

  • настроите мониторинг, SLO/SLA, алертинг в своей команде, чтобы бизнесу было спокойно, а инженеры перестали жить в режиме тушения пожаров
  • поймете, как пройти сопротивление команды при внедрении практик
  • сможете уверенно решать инциденты и выстраивать postmortem-процессы
  • получите полную картину SRE-практик, адаптированных под реалии российского бизнеса
  • систематизируете знания, почувствуете уверенность в скиллах и станете тем специалистом, которого не нужно доучивать
  • осознаете, какие метрики надо собирать и как это делать правильно
  • сможете снизить ущерб от отказов в будущем
  • сможете устранять конкретные проблемы, связанные с надежностью сервиса

Вы получите не гугловскую теорию, а рабочий опыт инженеров из российских компаний

Познакомьтесь с материалами и спикерами курса. Даем демодоступ на 3 дня

Полезно будет всем! Не только тем, кто находится в активном поиске работы

Вы поймете структуру и логику System Design интервью, а также повысите уверенность перед собеседованием

Техническое интервью — решающий этап отбора в крупные компании. На вебинаре мы покажем:

практические советы и разбор частых ошибок кандидатов

алгоритмы принятия решений при проектировании системы

реалистичный опыт прохождения технического этапа собеседования

Повышение
надежности сервисов

Улучшение производительности

Снижение
количества инцидентов

Эффективное
управление нагрузкой

Автоматизация и стандартизация

Кросс-функциональное взаимодействие команд

Обратная связь и улучшения

SRE обеспечивает высокую доступность и стабильность сервисов. Это критически важно для удовлетворенности пользователей.

Использование SRE-практик позволяет оптимизировать производительность систем. Задержки снижаются, скорость отклика повышается.

Внедрение превентивного мониторинга и автоматизации процессов минимизирует количество инцидентов и время их решения.

SRE позволяет анализировать и прогнозировать нагрузку на системы, что помогает лучше справляться с пиковыми периодами.

SRE внедряет автоматизированные процессы, что снижает количество рутинных задач и повышает эффективность работы команд.

SRE способствует более тесному сотрудничеству между разработчиками и операционными командами. Это улучшает коммуникацию и общий процесс разработки.

SRE-практики включают анализ инцидентов и создание постмортемов, что помогает выявлять слабые места и улучшать процессы.

Оптимизация процессов и автоматизация помогают сократить операционные расходы.

Обучение проходит в условиях имитации реальной работы — в специально разработанном приложении кинотеатра, в котором у каждого будет своя роль

Учебное приложение состоит из нескольких микросервисов. Он агрегирует данные о сеансах, ценах и свободных местах со всех кинотеатров, показывает анонсы фильмов, дает выбрать кинотеатр, сеанс, зал и место, забронировать и оплатить билеты.

Мы сформулируем показатели SLO, SLI, SLA для сервиса, разработаем архитектуру и инфраструктуру, которая их обеспечит, настроим мониторинг и алертинг.

Ошибки разработчиков, отказы инфраструктуры, наплыв посетителей, DoS-атаки приводят к тому, что SLO ухудшаются.

Мы разберем устойчивость, error budget, практику тестирования, управление прерываниями и операционной нагрузкой.

Произошла авария. Сервис обработки платежей лег. Как действовать, чтобы восстановить работоспособность в минимальные сроки?

Мы организуем работу группы по ликвидации аварии: подключение коллег, оповещение интересантов (stakeholders), выстраивание приоритетов. Будем тренироваться под давлением в условиях предельно ограниченного времени.

Разберем подход к сайту с точки зрения SRE. Проанализируем инциденты (причины возникновения, ход устранения).

Примем решение по их дальнейшему предотвращению: улучшим мониторинг, изменим архитектуру, подход к разработке и эксплуатации, регламенты. Автоматизируем процессы.

Внутренние и внешние факторы начинают «портить» SLO

Cмотрим на сайт и инциденты с точки зрения SRE

С чем предстоит работать

Вы будете поддерживать приложение, написанное на python, которое взаимодействует с базой данных MySQL для хранения информации. Оно будет развернуто микросервисной архитектурой на наших кластерах Kubernetes, к которым у вас будет доступ для решения проблем, возникших на инцидентах.

Это один из самых распространенных, простых и доступных языков программирования. Вы легко сможете разобраться в его коде и внести изменения, если это потребуются.

На изучение теории, работу в командах и общение со спикерами

Видеокурс «Мониторинг в Grafana»

Встречаемся со спикерами и делимся на команды

Делаем домашние задания, получаем фидбек от эксперта

Изучаем видеоуроки и читаем теорию

Выполняем практические задания и решаем кейсы в командах, имитируем работу SRE

Разбираем практические задания и кейсы со спикерами +задаем вопросы

Сдаем все практические задания и получаем сертификат

Без этих знаний обучаться будет трудно!

Будет большим плюсом, если вы:

  • Работали в кластере Kubernetes или просто знаете принципы работы
  • знаете, как работать в Grafana и Prometheus
  • умеете писать код на Python
  • Вы умеете читать код на Python
  • Знаете Linux на уровне администратора
  • Знание принципов работы Баз данных (любые: SQL, NoSQL, KeyVal)

Вступайте в наш канал Путь SRE

Если вы чувствуете себя неуверенно в работе с Kubernetes, вы можете дополнительно пройти подготовительный модуль.

Чтобы вы успели его пройти и подготовиться к обучению, рекомендуем занять место на курсе до 1 ноября

Руководитель продуктового направления в DevOps Tools, Yandex Cloud

Инженер с 10-летним опытом в DevOps. Отвечает за развитие сервисов Managed Kubernetes, Observability Platform,  Dev Tools. Спикер на конференциях: DevOops, DevOpsConf, Kuberconf и т. д.

Эксперт в области высоких нагрузок

Регулярный докладчик на конференциях и митах. Десятки успешных проектов по подъему нагрузки в США, Европе и России

Регулярный докладчик на конференциях и митапах. Фанат метрик

Автор нескольких курсов по DevOps и его внедрению. 100+ инсталляций Kubernetes в продакшен. 1000+ выстроенных пайплайнов CI/CD

Infrastructure Platform Technical Lead в Dodo Engineering

Спикер конференций HighLoad, DevOps Live, DevOops и Podlodka Crew. Технический лидер Dodo Engineering, внедрение культуры SRE

Подготовительный модуль по Kubernetes

Вы познакомитесь с основами архитектуры Kubernetes и её ключевыми компонентами. Вы узнаете, для чего нужны и как взаимодействуют основные объекты, такие как поды, репликасеты, деплойменты и сервисы.

17 ноября, пн – старт обучения. Открываем доступ к Telegram-чату потока

  • Подходы к мониторингу. Blackbox & Whitebox, 4 golden signals, RED, USE
  • Grafana, Prometheus & Alertmanager. Установка и настройка
  • Prometheus. Модель данных и типы метрик. Особенности мониторинга latency
  • Prometheus. PromQL
  • Grafana. Первый dashboard
  • Grafana. Tips & tricks
  • Alerting. Grafana vs Prometheus
  • Alerting. Тестирование
  • Обсудим цели и задачи курса
  • Расскажем, что такое SRE
  • Распределим студентов на команды
  • Monitoring и Observability
  • SLO, SLI, SLA
  • Error budget

Практикум № 1 и командные кейсы

  • Добавляем на дашборды SLO, SLI и Error budget (Первичная нагрузка)
  • Работаем с k8s, исправляем ошибки в коде, разбираем архитектуру приложения
  • SRE в других компаниях: как устроена работа с метриками
  • Ответы на вопросы по предыдущим темам
  • Обратная связь по домашнему заданию
  • Resiliencе Engineering и устройство команды
  • Инструменты варрума
  • Postmortem

Практикум № 2 и командные кейсы

  • Работаем в команде и устраняем проблемы в приложении, развернутом в Kubernetes кластере, на основе метрик
  • По окончании практики вы получите комплект шаблонов постмортемов
  • Работа с инцидентами, продом и прочие практики SRE
  • Ответы на вопросы по предыдущим темам
  • Health Check в Kubernetes
  • Exec probes
  • InitialDelaySeconds
  • Secondary Health Port
  • Sidecar Health Server
  • Headless Probe
  • Hardware Probe

Практикум № 3 и командные кейсы

  • Реализация Fail-fast подхода: учимся быстро выявлять проблемы и минимизировать их последствия
  • Реализация канареечных деплоев: работаем с Argo Rollouts и учимся деплоить с минимальным аффектом пользователей
  • Тренды и технологии, карьера и развитие в SRE
  • Ответы на вопросы по предыдущим темам
  • Подведение итогов и завершение обучения

Именной сертификат с индивидуальным номером получает студент, если:

  • прошёл 80% курса
  • посетил все 3 субботние практики
  • успешно сдавал домашние задания

В случае, если студент изучил 80% курса, но не выполнял домашние задания или не посетил все практики, вместо сертификата выдаётся свидетельство.

Если вы считаете, что знания, полученные на курсе, могут быть полезными на вашем текущем месте работы, оставляйте заявку с контактами компании в форме ниже или обсудите покупку курса с вашим руководителем. Как это организовать, что говорить и куда идти — написали здесь.

Mock-интервью с экспертом

Помощь в подготовке к резюме и портфолио

Видеокурс «Мониторинг в Grafana»

Проверка домашних заданий экспертом

Командные практикумы и кейсы

Персональные сессии с экспертом и IT-рекрутером

Помощь в подготовке к резюме и портфолио

Персональные сессии с экспертом и IT-рекрутером

Поддержка от куратора группы

Чат-группы Телеграм со спикерами

Виртуальные стенды для практики

Подготовительный модуль по Kubernetes

в рассрочку на 4 месяца или 60 000 ₽ единовременно

В 75% случаев обучение готова оплатить компания. Напишите нам, и мы поможем.

Курс за счёт работодателя

Предоставим все необходимые документы для получения вычета.

Видеокурс «Мониторинг в Grafana»

Подготовительный модуль по Kubernetes

Проверка домашних заданий экспертом

Командные практикумы и кейсы

Виртуальные стенды для практики

Чат-группы Телеграм со спикерами

Поддержка от куратора группы

Оставьте заявку, и наш менеджер свяжется с вами

Стоимость доступна по запросу

Предоставим все необходимые документы для получения вычета.

Курс за счёт работодателя

В 75% случаев обучение готова оплатить компания. Напишите нам, и мы поможем.

только для физических лиц

от 10 человек
специальные условия

Выгодно и быстро обучим целые команды. Единоразовое оформление и быстрый доступ к курсам.

Подарите своему сотруднику скидку или курс целиком. А мы упакуем ;)

Mock-интервью с экспертом

Помощь в подготовке к резюме и портфолио

Видеокурс «Мониторинг в Grafana»

Проверка домашних заданий экспертом

Командные практикумы и кейсы

Персональные сессии с экспертом и IT-рекрутером

Помощь в подготовке к резюме и портфолио

Персональные сессии с экспертом и IT-рекрутером

Поддержка от куратора группы

Чат-группы Телеграм со спикерами

Виртуальные стенды для практики

Подготовительный модуль по Kubernetes

Видеокурс «Мониторинг в Grafana»

Подготовительный модуль по Kubernetes

Проверка домашних заданий экспертом

Командные практикумы и кейсы

Виртуальные стенды для практики

Чат-группы Телеграм со спикерами

Поддержка от куратора группы

Оставьте заявку, и наш менеджер свяжется с вами

Стоимость доступна по запросу

Подарите своему сотруднику скидку или курс целиком. А мы упакуем ;)

Выгодно и быстро обучим целые команды. Единоразовое оформление и быстрый доступ к курсам.

Часто задаваемые вопросы

Если ваша задача — обучить больше 30 сотрудников, мы готовы предложить вашей компании корпоративный формат обучения или адаптировать обучение под вас

Пример корпоративного обучения по Kubernetes для сотрудников Тинькофф банка →