0 added
0 removed
Original
2026-01-01
Modified
2026-03-10
1
<ul><li><a>Для чего всё это нужно</a></li>
1
<ul><li><a>Для чего всё это нужно</a></li>
2
<li><a>Что планировалось</a></li>
2
<li><a>Что планировалось</a></li>
3
<li><a>Что получилось</a></li>
3
<li><a>Что получилось</a></li>
4
<li><a>Что пока не получилось</a></li>
4
<li><a>Что пока не получилось</a></li>
5
<li><a>Выводы и планы по развитию</a></li>
5
<li><a>Выводы и планы по развитию</a></li>
6
</ul><p><em>Артём Марченко, студент курса "<a>Руководитель поддержки пользователей в IT</a>", руководитель проектов высшей категории в "1С-КСУ".</em></p>
6
</ul><p><em>Артём Марченко, студент курса "<a>Руководитель поддержки пользователей в IT</a>", руководитель проектов высшей категории в "1С-КСУ".</em></p>
7
<h2><strong>Для чего всё это нужно</strong></h2>
7
<h2><strong>Для чего всё это нужно</strong></h2>
8
<p>Постмортем инцидентов (некая разновидность ретроспективы) - это критический анализ, который проводят после возникновения проблемы. Например, после сбоя в работе сервиса.</p>
8
<p>Постмортем инцидентов (некая разновидность ретроспективы) - это критический анализ, который проводят после возникновения проблемы. Например, после сбоя в работе сервиса.</p>
9
<p>Постмортем поможет вам понять:</p>
9
<p>Постмортем поможет вам понять:</p>
10
<ul><li>что произошло</li>
10
<ul><li>что произошло</li>
11
<li>почему это случилось</li>
11
<li>почему это случилось</li>
12
<li>как можно предотвратить подобные случаи в будущем</li>
12
<li>как можно предотвратить подобные случаи в будущем</li>
13
</ul><p>Первое и очевидное преимущество постмортема: вы сможете глубоко разобраться в причинах инцидента. Речь не только о точном определении технического сбоя, но и о раскрытии последовательности событий, которые привели к аварии. </p>
13
</ul><p>Первое и очевидное преимущество постмортема: вы сможете глубоко разобраться в причинах инцидента. Речь не только о точном определении технического сбоя, но и о раскрытии последовательности событий, которые привели к аварии. </p>
14
<p>Глубоко погружаясь в вопросы "как?" и "почему?", мы обнаружим не только внешние симптомы проблемы, но и проникнем в причины уязвимости системы, в технический и человеческий фактор инцидента. </p>
14
<p>Глубоко погружаясь в вопросы "как?" и "почему?", мы обнаружим не только внешние симптомы проблемы, но и проникнем в причины уязвимости системы, в технический и человеческий фактор инцидента. </p>
15
<p><strong>То есть мы не просто тушим пожар, а стараемся понять, почему именно произошло возгорание.</strong></p>
15
<p><strong>То есть мы не просто тушим пожар, а стараемся понять, почему именно произошло возгорание.</strong></p>
16
<p>Наша команда сопровождает системно-техническую инфраструктуру поставщика SaaS-решения. И мы предполагаем, что внедрение такой практики может принести несколько ключевых преимуществ:</p>
16
<p>Наша команда сопровождает системно-техническую инфраструктуру поставщика SaaS-решения. И мы предполагаем, что внедрение такой практики может принести несколько ключевых преимуществ:</p>
17
<ul><li>повысить качество работы сервиса</li>
17
<ul><li>повысить качество работы сервиса</li>
18
<li>ускорить время решения инцидентов</li>
18
<li>ускорить время решения инцидентов</li>
19
<li>предотвратить новые инциденты</li>
19
<li>предотвратить новые инциденты</li>
20
<li>повысить эффективность управления рисками</li>
20
<li>повысить эффективность управления рисками</li>
21
</ul><p>Если проводить постмортемы на регулярной основе, можно выявить не только технические неполадки, но и любые неэффективные действия в процессе реагирования на инциденты. То есть обнаруживать потенциальные риски до того, как они проявятся в виде реальных сбоев. Заблаговременно обнаруживая эти уязвимости, наша компания может лучше управлять безопасностью данных заказчика.</p>
21
</ul><p>Если проводить постмортемы на регулярной основе, можно выявить не только технические неполадки, но и любые неэффективные действия в процессе реагирования на инциденты. То есть обнаруживать потенциальные риски до того, как они проявятся в виде реальных сбоев. Заблаговременно обнаруживая эти уязвимости, наша компания может лучше управлять безопасностью данных заказчика.</p>
22
<h2><strong>Что планировалось</strong></h2>
22
<h2><strong>Что планировалось</strong></h2>
23
<ul><li>С помощью постмортемов начать собирать информацию по завершённым инцидентам для последующего анализа.</li>
23
<ul><li>С помощью постмортемов начать собирать информацию по завершённым инцидентам для последующего анализа.</li>
24
<li>Получать структурированную информацию, чтобы в дальнейшем добавить её в базу знаний поддержки.</li>
24
<li>Получать структурированную информацию, чтобы в дальнейшем добавить её в базу знаний поддержки.</li>
25
<li>Использовать полученные знания в ежедневной работе: рассмотрение и разрешение различных инцидентов расширяет набор навыков и готовит команду к будущим задачам.</li>
25
<li>Использовать полученные знания в ежедневной работе: рассмотрение и разрешение различных инцидентов расширяет набор навыков и готовит команду к будущим задачам.</li>
26
</ul><h2><strong>Что получилось</strong></h2>
26
</ul><h2><strong>Что получилось</strong></h2>
27
<ul><li>Внедрили постмортемы в работу службы поддержки на обязательной основе.</li>
27
<ul><li>Внедрили постмортемы в работу службы поддержки на обязательной основе.</li>
28
<li>По результатам постмортемов поставили первые задачи. Например, на доработку системы мониторинга.</li>
28
<li>По результатам постмортемов поставили первые задачи. Например, на доработку системы мониторинга.</li>
29
</ul><p><strong>Что интересно.</strong>Проанализировав документы постмортемов, мы стали более пристально следить за случаями нестандартного поведения отдельных элементов системы (при получении нескольких обращений от пользователей и отсутствии "объективных" сигналов со стороны системы мониторинга). Так мы стараемся выявить проблему на самых ранних этапах. Такой превентивный подход поможет не просто реагировать на возникающие проблемы, а обнаруживать "аномалии", которые их порождают. </p>
29
</ul><p><strong>Что интересно.</strong>Проанализировав документы постмортемов, мы стали более пристально следить за случаями нестандартного поведения отдельных элементов системы (при получении нескольких обращений от пользователей и отсутствии "объективных" сигналов со стороны системы мониторинга). Так мы стараемся выявить проблему на самых ранних этапах. Такой превентивный подход поможет не просто реагировать на возникающие проблемы, а обнаруживать "аномалии", которые их порождают. </p>
30
<h2><strong>Что пока не получилось</strong></h2>
30
<h2><strong>Что пока не получилось</strong></h2>
31
<ul><li>Своевременно заполнять документы постмортемов. Когда авария позади, кажется, что можно расслабиться, а потом наступает новый день и появляются новые проблемы.</li>
31
<ul><li>Своевременно заполнять документы постмортемов. Когда авария позади, кажется, что можно расслабиться, а потом наступает новый день и появляются новые проблемы.</li>
32
<li>Отслеживать, как выполняются рекомендации, созданные по результатам анализа постмортема.</li>
32
<li>Отслеживать, как выполняются рекомендации, созданные по результатам анализа постмортема.</li>
33
<li>Выйти на общесистемный уровень и рассматривать, как более широкие элементы системы - управление, процессы, технологии - могли повлиять на инцидент.</li>
33
<li>Выйти на общесистемный уровень и рассматривать, как более широкие элементы системы - управление, процессы, технологии - могли повлиять на инцидент.</li>
34
<li>Отработать процесс дальнейшего распространения и использования полученных знаний.</li>
34
<li>Отработать процесс дальнейшего распространения и использования полученных знаний.</li>
35
</ul><h2><strong>Выводы и планы по развитию</strong></h2>
35
</ul><h2><strong>Выводы и планы по развитию</strong></h2>
36
<p>Пока что постмортемы показывают себя эффективно.</p>
36
<p>Пока что постмортемы показывают себя эффективно.</p>
37
<p>Но сейчас всю работу [по процедуре постмортема] выполняет руководитель службы поддержки. Поэтому нужно наладить делегирование и контроль за выполнением.</p>
37
<p>Но сейчас всю работу [по процедуре постмортема] выполняет руководитель службы поддержки. Поэтому нужно наладить делегирование и контроль за выполнением.</p>
38
<p>Регулярные постмортемы мы рассматриваем, как вклад в культуру, которая помогает обмениваться знаниями и решать проблемы коллективно. Когда члены команды изучают и расширяют список различных типов инцидентов, повышается способность эффективно действовать в нестандартных ситуациях.</p>
38
<p>Регулярные постмортемы мы рассматриваем, как вклад в культуру, которая помогает обмениваться знаниями и решать проблемы коллективно. Когда члены команды изучают и расширяют список различных типов инцидентов, повышается способность эффективно действовать в нестандартных ситуациях.</p>
39
<p><strong>Важно.</strong>К постомортему следует подходить с "правильным настроем".<strong>То есть делать упор на обучение, а не на обвинение других.</strong>Ведь мы хотим создать среду, в которой ошибки рассматриваются, как возможность для совершенствования.</p>
39
<p><strong>Важно.</strong>К постомортему следует подходить с "правильным настроем".<strong>То есть делать упор на обучение, а не на обвинение других.</strong>Ведь мы хотим создать среду, в которой ошибки рассматриваются, как возможность для совершенствования.</p>
40
<p>Если практика постмортемов даст видимые положительные результаты, то в дальнейшем можно распространить её и на другие проекты компании.</p>
40
<p>Если практика постмортемов даст видимые положительные результаты, то в дальнейшем можно распространить её и на другие проекты компании.</p>
41
41