HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-03-10
1 <ul><li><a>Для чего всё это нужно</a></li>
1 <ul><li><a>Для чего всё это нужно</a></li>
2 <li><a>Что планировалось</a></li>
2 <li><a>Что планировалось</a></li>
3 <li><a>Что получилось</a></li>
3 <li><a>Что получилось</a></li>
4 <li><a>Что пока не получилось</a></li>
4 <li><a>Что пока не получилось</a></li>
5 <li><a>Выводы и планы по развитию</a></li>
5 <li><a>Выводы и планы по развитию</a></li>
6 </ul><p><em>Артём Марченко, студент курса "<a>Руководитель поддержки пользователей в IT</a>", руководитель проектов высшей категории в "1С-КСУ".</em></p>
6 </ul><p><em>Артём Марченко, студент курса "<a>Руководитель поддержки пользователей в IT</a>", руководитель проектов высшей категории в "1С-КСУ".</em></p>
7 <h2><strong>Для чего всё это нужно</strong></h2>
7 <h2><strong>Для чего всё это нужно</strong></h2>
8 <p>Постмортем инцидентов (некая разновидность ретроспективы) - это критический анализ, который проводят после возникновения проблемы. Например, после сбоя в работе сервиса.</p>
8 <p>Постмортем инцидентов (некая разновидность ретроспективы) - это критический анализ, который проводят после возникновения проблемы. Например, после сбоя в работе сервиса.</p>
9 <p>Постмортем поможет вам понять:</p>
9 <p>Постмортем поможет вам понять:</p>
10 <ul><li>что произошло</li>
10 <ul><li>что произошло</li>
11 <li>почему это случилось</li>
11 <li>почему это случилось</li>
12 <li>как можно предотвратить подобные случаи в будущем</li>
12 <li>как можно предотвратить подобные случаи в будущем</li>
13 </ul><p>Первое и очевидное преимущество постмортема: вы сможете глубоко разобраться в причинах инцидента. Речь не только о точном определении технического сбоя, но и о раскрытии последовательности событий, которые привели к аварии. </p>
13 </ul><p>Первое и очевидное преимущество постмортема: вы сможете глубоко разобраться в причинах инцидента. Речь не только о точном определении технического сбоя, но и о раскрытии последовательности событий, которые привели к аварии. </p>
14 <p>Глубоко погружаясь в вопросы "как?" и "почему?", мы обнаружим не только внешние симптомы проблемы, но и проникнем в причины уязвимости системы, в технический и человеческий фактор инцидента. </p>
14 <p>Глубоко погружаясь в вопросы "как?" и "почему?", мы обнаружим не только внешние симптомы проблемы, но и проникнем в причины уязвимости системы, в технический и человеческий фактор инцидента. </p>
15 <p><strong>То есть мы не просто тушим пожар, а стараемся понять, почему именно произошло возгорание.</strong></p>
15 <p><strong>То есть мы не просто тушим пожар, а стараемся понять, почему именно произошло возгорание.</strong></p>
16 <p>Наша команда сопровождает системно-техническую инфраструктуру поставщика SaaS-решения. И мы предполагаем, что внедрение такой практики может принести несколько ключевых преимуществ:</p>
16 <p>Наша команда сопровождает системно-техническую инфраструктуру поставщика SaaS-решения. И мы предполагаем, что внедрение такой практики может принести несколько ключевых преимуществ:</p>
17 <ul><li>повысить качество работы сервиса</li>
17 <ul><li>повысить качество работы сервиса</li>
18 <li>ускорить время решения инцидентов</li>
18 <li>ускорить время решения инцидентов</li>
19 <li>предотвратить новые инциденты</li>
19 <li>предотвратить новые инциденты</li>
20 <li>повысить эффективность управления рисками</li>
20 <li>повысить эффективность управления рисками</li>
21 </ul><p>Если проводить постмортемы на регулярной основе, можно выявить не только технические неполадки, но и любые неэффективные действия в процессе реагирования на инциденты. То есть обнаруживать потенциальные риски до того, как они проявятся в виде реальных сбоев. Заблаговременно обнаруживая эти уязвимости, наша компания может лучше управлять безопасностью данных заказчика.</p>
21 </ul><p>Если проводить постмортемы на регулярной основе, можно выявить не только технические неполадки, но и любые неэффективные действия в процессе реагирования на инциденты. То есть обнаруживать потенциальные риски до того, как они проявятся в виде реальных сбоев. Заблаговременно обнаруживая эти уязвимости, наша компания может лучше управлять безопасностью данных заказчика.</p>
22 <h2><strong>Что планировалось</strong></h2>
22 <h2><strong>Что планировалось</strong></h2>
23 <ul><li>С помощью постмортемов начать собирать информацию по завершённым инцидентам для последующего анализа.</li>
23 <ul><li>С помощью постмортемов начать собирать информацию по завершённым инцидентам для последующего анализа.</li>
24 <li>Получать структурированную информацию, чтобы в дальнейшем добавить её в базу знаний поддержки.</li>
24 <li>Получать структурированную информацию, чтобы в дальнейшем добавить её в базу знаний поддержки.</li>
25 <li>Использовать полученные знания в ежедневной работе: рассмотрение и разрешение различных инцидентов расширяет набор навыков и готовит команду к будущим задачам.</li>
25 <li>Использовать полученные знания в ежедневной работе: рассмотрение и разрешение различных инцидентов расширяет набор навыков и готовит команду к будущим задачам.</li>
26 </ul><h2><strong>Что получилось</strong></h2>
26 </ul><h2><strong>Что получилось</strong></h2>
27 <ul><li>Внедрили постмортемы в работу службы поддержки на обязательной основе.</li>
27 <ul><li>Внедрили постмортемы в работу службы поддержки на обязательной основе.</li>
28 <li>По результатам постмортемов поставили первые задачи. Например, на доработку системы мониторинга.</li>
28 <li>По результатам постмортемов поставили первые задачи. Например, на доработку системы мониторинга.</li>
29 </ul><p><strong>Что интересно.</strong>Проанализировав документы постмортемов, мы стали более пристально следить за случаями нестандартного поведения отдельных элементов системы (при получении нескольких обращений от пользователей и отсутствии "объективных" сигналов со стороны системы мониторинга). Так мы стараемся выявить проблему на самых ранних этапах. Такой превентивный подход поможет не просто реагировать на возникающие проблемы, а обнаруживать "аномалии", которые их порождают. </p>
29 </ul><p><strong>Что интересно.</strong>Проанализировав документы постмортемов, мы стали более пристально следить за случаями нестандартного поведения отдельных элементов системы (при получении нескольких обращений от пользователей и отсутствии "объективных" сигналов со стороны системы мониторинга). Так мы стараемся выявить проблему на самых ранних этапах. Такой превентивный подход поможет не просто реагировать на возникающие проблемы, а обнаруживать "аномалии", которые их порождают. </p>
30 <h2><strong>Что пока не получилось</strong></h2>
30 <h2><strong>Что пока не получилось</strong></h2>
31 <ul><li>Своевременно заполнять документы постмортемов. Когда авария позади, кажется, что можно расслабиться, а потом наступает новый день и появляются новые проблемы.</li>
31 <ul><li>Своевременно заполнять документы постмортемов. Когда авария позади, кажется, что можно расслабиться, а потом наступает новый день и появляются новые проблемы.</li>
32 <li>Отслеживать, как выполняются рекомендации, созданные по результатам анализа постмортема.</li>
32 <li>Отслеживать, как выполняются рекомендации, созданные по результатам анализа постмортема.</li>
33 <li>Выйти на общесистемный уровень и рассматривать, как более широкие элементы системы - управление, процессы, технологии - могли повлиять на инцидент.</li>
33 <li>Выйти на общесистемный уровень и рассматривать, как более широкие элементы системы - управление, процессы, технологии - могли повлиять на инцидент.</li>
34 <li>Отработать процесс дальнейшего распространения и использования полученных знаний.</li>
34 <li>Отработать процесс дальнейшего распространения и использования полученных знаний.</li>
35 </ul><h2><strong>Выводы и планы по развитию</strong></h2>
35 </ul><h2><strong>Выводы и планы по развитию</strong></h2>
36 <p>Пока что постмортемы показывают себя эффективно.</p>
36 <p>Пока что постмортемы показывают себя эффективно.</p>
37 <p>Но сейчас всю работу [по процедуре постмортема] выполняет руководитель службы поддержки. Поэтому нужно наладить делегирование и контроль за выполнением.</p>
37 <p>Но сейчас всю работу [по процедуре постмортема] выполняет руководитель службы поддержки. Поэтому нужно наладить делегирование и контроль за выполнением.</p>
38 <p>Регулярные постмортемы мы рассматриваем, как вклад в культуру, которая помогает обмениваться знаниями и решать проблемы коллективно. Когда члены команды изучают и расширяют список различных типов инцидентов, повышается способность эффективно действовать в нестандартных ситуациях.</p>
38 <p>Регулярные постмортемы мы рассматриваем, как вклад в культуру, которая помогает обмениваться знаниями и решать проблемы коллективно. Когда члены команды изучают и расширяют список различных типов инцидентов, повышается способность эффективно действовать в нестандартных ситуациях.</p>
39 <p><strong>Важно.</strong>К постомортему следует подходить с "правильным настроем".<strong>То есть делать упор на обучение, а не на обвинение других.</strong>Ведь мы хотим создать среду, в которой ошибки рассматриваются, как возможность для совершенствования.</p>
39 <p><strong>Важно.</strong>К постомортему следует подходить с "правильным настроем".<strong>То есть делать упор на обучение, а не на обвинение других.</strong>Ведь мы хотим создать среду, в которой ошибки рассматриваются, как возможность для совершенствования.</p>
40 <p>Если практика постмортемов даст видимые положительные результаты, то в дальнейшем можно распространить её и на другие проекты компании.</p>
40 <p>Если практика постмортемов даст видимые положительные результаты, то в дальнейшем можно распространить её и на другие проекты компании.</p>
41  
41