0 added
0 removed
Original
2026-01-01
Modified
2026-02-19
1
<p>Допустим, у вас есть сервис, который должен работать 99.9% времени. Это значит, что 0.1% времени он может лежать - и это нормально.</p>
1
<p>Допустим, у вас есть сервис, который должен работать 99.9% времени. Это значит, что 0.1% времени он может лежать - и это нормально.</p>
2
<p>Но что делает большинство разработчиков и менеджеров? Паникует при каждом сбое и бросается чинить баги любой ценой. И вот тут SRE-инженеры говорят: "Стоп! Давайте посчитаем Error Budget".</p>
2
<p>Но что делает большинство разработчиков и менеджеров? Паникует при каждом сбое и бросается чинить баги любой ценой. И вот тут SRE-инженеры говорят: "Стоп! Давайте посчитаем Error Budget".</p>
3
<p><strong>Что такое Error Budget?</strong></p>
3
<p><strong>Что такое Error Budget?</strong></p>
4
<p>Это запас "разрешённых" сбоев, который закладывается в SLO (Service Level Objective). Например, если ваш SLA - 99.9% аптайма в месяц, значит, вы можете позволить себе до 43 минут простоя. Подробнее о сути и различиях SLO и SLA, писали<a>тут.</a></p>
4
<p>Это запас "разрешённых" сбоев, который закладывается в SLO (Service Level Objective). Например, если ваш SLA - 99.9% аптайма в месяц, значит, вы можете позволить себе до 43 минут простоя. Подробнее о сути и различиях SLO и SLA, писали<a>тут.</a></p>
5
<p><strong>Почему иногда баги лучше не чинить?</strong></p>
5
<p><strong>Почему иногда баги лучше не чинить?</strong></p>
6
<ul><li>Фикс может сломать что-то ещё - исправление одного бага может породить новые инциденты.</li>
6
<ul><li>Фикс может сломать что-то ещё - исправление одного бага может породить новые инциденты.</li>
7
<li>Релизная гонка - если Error Budget не исчерпан, лучше сфокусироваться на фичах, а не на "перестраховке".</li>
7
<li>Релизная гонка - если Error Budget не исчерпан, лучше сфокусироваться на фичах, а не на "перестраховке".</li>
8
<li>Приоритеты бизнеса - иногда баг мешает 1% пользователей, а новая фича увеличит доход на 10%.</li>
8
<li>Приоритеты бизнеса - иногда баг мешает 1% пользователей, а новая фича увеличит доход на 10%.</li>
9
</ul><p><strong>Как использовать Error Budget?</strong></p>
9
</ul><p><strong>Как использовать Error Budget?</strong></p>
10
<p>- Если бюджет заканчивается раньше срока → замедляем релизы, усиливаем тестирование.</p>
10
<p>- Если бюджет заканчивается раньше срока → замедляем релизы, усиливаем тестирование.</p>
11
<p>- Если бюджет не исчерпан → можно делать более агрессивные изменения и не бояться экспериментов.</p>
11
<p>- Если бюджет не исчерпан → можно делать более агрессивные изменения и не бояться экспериментов.</p>
12
<p>- Если сервис часто выходит за рамки бюджета → нужно пересматривать архитектуру, мониторинг и процессы.</p>
12
<p>- Если сервис часто выходит за рамки бюджета → нужно пересматривать архитектуру, мониторинг и процессы.</p>
13
<p><strong>Вывод:</strong></p>
13
<p><strong>Вывод:</strong></p>
14
<p>Error Budget - это не просто цифры, а инструмент управления балансом между скоростью и надёжностью. Иногда лучше оставить баг в покое и не ломать систему ради фикса.</p>
14
<p>Error Budget - это не просто цифры, а инструмент управления балансом между скоростью и надёжностью. Иногда лучше оставить баг в покое и не ломать систему ради фикса.</p>