Rivalry2

HTML Diff

0 added 0 removed

Original 2026-01-01

Modified 2026-03-10

1 <ul><li><a>Для чего всё это нужно</a></li>

2 <li><a>Что планировалось</a></li>

3 <li><a>Что получилось</a></li>

4 <li><a>Что пока не получилось</a></li>

5 <li><a>Выводы и планы по развитию</a></li>

6 </ul><p><em>Артём Марченко, студент курса "<a>Руководитель поддержки пользователей в IT</a>", руководитель проектов высшей категории в "1С-КСУ".</em></p>

7 <h2><strong>Для чего всё это нужно</strong></h2>

8 <p>Постмортем инцидентов (некая разновидность ретроспективы) - это критический анализ, который проводят после возникновения проблемы. Например, после сбоя в работе сервиса.</p>

9 <p>Постмортем поможет вам понять:</p>

10 <ul><li>что произошло</li>

11 <li>почему это случилось</li>

12 <li>как можно предотвратить подобные случаи в будущем</li>

13 </ul><p>Первое и очевидное преимущество постмортема: вы сможете глубоко разобраться в причинах инцидента. Речь не только о точном определении технического сбоя, но и о раскрытии последовательности событий, которые привели к аварии. </p>

14 <p>Глубоко погружаясь в вопросы "как?" и "почему?", мы обнаружим не только внешние симптомы проблемы, но и проникнем в причины уязвимости системы, в технический и человеческий фактор инцидента. </p>

15 <p><strong>То есть мы не просто тушим пожар, а стараемся понять, почему именно произошло возгорание.</strong></p>

16 <p>Наша команда сопровождает системно-техническую инфраструктуру поставщика SaaS-решения. И мы предполагаем, что внедрение такой практики может принести несколько ключевых преимуществ:</p>

17 <ul><li>повысить качество работы сервиса</li>

18 <li>ускорить время решения инцидентов</li>

19 <li>предотвратить новые инциденты</li>

20 <li>повысить эффективность управления рисками</li>

21 </ul><p>Если проводить постмортемы на регулярной основе, можно выявить не только технические неполадки, но и любые неэффективные действия в процессе реагирования на инциденты. То есть обнаруживать потенциальные риски до того, как они проявятся в виде реальных сбоев. Заблаговременно обнаруживая эти уязвимости, наша компания может лучше управлять безопасностью данных заказчика.</p>

22 <h2><strong>Что планировалось</strong></h2>

23 <ul><li>С помощью постмортемов начать собирать информацию по завершённым инцидентам для последующего анализа.</li>

24 <li>Получать структурированную информацию, чтобы в дальнейшем добавить её в базу знаний поддержки.</li>

25 <li>Использовать полученные знания в ежедневной работе: рассмотрение и разрешение различных инцидентов расширяет набор навыков и готовит команду к будущим задачам.</li>

26 </ul><h2><strong>Что получилось</strong></h2>

27 <ul><li>Внедрили постмортемы в работу службы поддержки на обязательной основе.</li>

28 <li>По результатам постмортемов поставили первые задачи. Например, на доработку системы мониторинга.</li>

29 </ul><p><strong>Что интересно.</strong>Проанализировав документы постмортемов, мы стали более пристально следить за случаями нестандартного поведения отдельных элементов системы (при получении нескольких обращений от пользователей и отсутствии "объективных" сигналов со стороны системы мониторинга). Так мы стараемся выявить проблему на самых ранних этапах. Такой превентивный подход поможет не просто реагировать на возникающие проблемы, а обнаруживать "аномалии", которые их порождают. </p>

30 <h2><strong>Что пока не получилось</strong></h2>

31 <ul><li>Своевременно заполнять документы постмортемов. Когда авария позади, кажется, что можно расслабиться, а потом наступает новый день и появляются новые проблемы.</li>

32 <li>Отслеживать, как выполняются рекомендации, созданные по результатам анализа постмортема.</li>

33 <li>Выйти на общесистемный уровень и рассматривать, как более широкие элементы системы - управление, процессы, технологии - могли повлиять на инцидент.</li>

34 <li>Отработать процесс дальнейшего распространения и использования полученных знаний.</li>

35 </ul><h2><strong>Выводы и планы по развитию</strong></h2>

36 <p>Пока что постмортемы показывают себя эффективно.</p>

37 <p>Но сейчас всю работу [по процедуре постмортема] выполняет руководитель службы поддержки. Поэтому нужно наладить делегирование и контроль за выполнением.</p>

38 <p>Регулярные постмортемы мы рассматриваем, как вклад в культуру, которая помогает обмениваться знаниями и решать проблемы коллективно. Когда члены команды изучают и расширяют список различных типов инцидентов, повышается способность эффективно действовать в нестандартных ситуациях.</p>

39 <p><strong>Важно.</strong>К постомортему следует подходить с "правильным настроем".<strong>То есть делать упор на обучение, а не на обвинение других.</strong>Ведь мы хотим создать среду, в которой ошибки рассматриваются, как возможность для совершенствования.</p>

40 <p>Если практика постмортемов даст видимые положительные результаты, то в дальнейшем можно распространить её и на другие проекты компании.</p>