HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-03-10
1 <p>Нередко бывает, что программы ломаются, а серверы падают. Вряд ли этого можно избежать со 100%-ной вероятностью. Скачок напряжения, случайный баг, сбои в подаче электроэнергии - эти и многие другие факторы способны вызвать поломки. Минимизировать вероятность появления проблемы поможет мониторинг.</p>
1 <p>Нередко бывает, что программы ломаются, а серверы падают. Вряд ли этого можно избежать со 100%-ной вероятностью. Скачок напряжения, случайный баг, сбои в подаче электроэнергии - эти и многие другие факторы способны вызвать поломки. Минимизировать вероятность появления проблемы поможет мониторинг.</p>
2 <p>Мониторинг предполагает сбор и анализ разных параметров поведения системы. Благодаря мониторингу вы сможете описать каждый важный аспект вашего проекта и измерить его в числовом выражении.</p>
2 <p>Мониторинг предполагает сбор и анализ разных параметров поведения системы. Благодаря мониторингу вы сможете описать каждый важный аспект вашего проекта и измерить его в числовом выражении.</p>
3 <p>У современного мониторинга есть несколько уровней. В этой статье мы поговорим про самый нижний - мониторинг оборудования</p>
3 <p>У современного мониторинга есть несколько уровней. В этой статье мы поговорим про самый нижний - мониторинг оборудования</p>
4 <h2>Особенности мониторинга оборудования</h2>
4 <h2>Особенности мониторинга оборудования</h2>
5 <p>Как правило, серверы располагаются в дата-центре, причём у них есть конкретные параметры и показатели производительности. Данные параметры следует мониторить в первую очередь, делая это на каждом сервере, который обслуживает ваших клиентов.</p>
5 <p>Как правило, серверы располагаются в дата-центре, причём у них есть конкретные параметры и показатели производительности. Данные параметры следует мониторить в первую очередь, делая это на каждом сервере, который обслуживает ваших клиентов.</p>
6 <p>Вас должны интересовать: • нагрузка на процессор; • свободное место на жёстком диске и в оперативной памяти; • нагрузка на сеть; • нагрузка на жесткий диск (имеется в виду число операций на чтение и запись); • количество задач, которые запущены на исполнение.</p>
6 <p>Вас должны интересовать: • нагрузка на процессор; • свободное место на жёстком диске и в оперативной памяти; • нагрузка на сеть; • нагрузка на жесткий диск (имеется в виду число операций на чтение и запись); • количество задач, которые запущены на исполнение.</p>
7 <p>Вышеупомянутый перечень очевиден. Регулярно отслеживать эти значения - значит вовремя диагностировать и предотвратить множество неприятных ситуаций, способных стать причиной полного либо частичного коллапса инфраструктуры со всеми вытекающими отсюда репутационными и финансовыми потерями.</p>
7 <p>Вышеупомянутый перечень очевиден. Регулярно отслеживать эти значения - значит вовремя диагностировать и предотвратить множество неприятных ситуаций, способных стать причиной полного либо частичного коллапса инфраструктуры со всеми вытекающими отсюда репутационными и финансовыми потерями.</p>
8 <h4>На что стоит обратить особое внимание:</h4>
8 <h4>На что стоит обратить особое внимание:</h4>
9 <ol><li>Нагрузка близка к критической, железо на грани отказа (возможно, пришло время масштабироваться).</li>
9 <ol><li>Нагрузка близка к критической, железо на грани отказа (возможно, пришло время масштабироваться).</li>
10 <li>Вы выкатили новый релиз, но как-то подозрительно быстро закончилась память (ситуация из серии "нас опять взломали!").</li>
10 <li>Вы выкатили новый релиз, но как-то подозрительно быстро закончилась память (ситуация из серии "нас опять взломали!").</li>
11 <li>Вы ничего не выкатывали, однако после очередной рекламной кампании скачкообразно повысилось число клиентов, поэтому скоро всё упадет.</li>
11 <li>Вы ничего не выкатывали, однако после очередной рекламной кампании скачкообразно повысилось число клиентов, поэтому скоро всё упадет.</li>
12 </ol><p>Чтобы анализировать поведение серверов в простейшем виде, вполне подходят штатные средства контроля типа<strong>htop</strong>. Если же интересует более гибкое и масштабируемое решение, можно воспользоваться<strong>Zabbix</strong>, который уже способен анализировать главные параметры целого кластера серверов, а также собирать их в единой панели. Но это решение уже потребует настроек, выполнить которые может квалифицированный системный администратор.</p>
12 </ol><p>Чтобы анализировать поведение серверов в простейшем виде, вполне подходят штатные средства контроля типа<strong>htop</strong>. Если же интересует более гибкое и масштабируемое решение, можно воспользоваться<strong>Zabbix</strong>, который уже способен анализировать главные параметры целого кластера серверов, а также собирать их в единой панели. Но это решение уже потребует настроек, выполнить которые может квалифицированный системный администратор.</p>
13 <p>Что касается пользователей контейнерных систем, то тут для мониторинга вполне подойдёт штатный<strong>Kubernetes Dashboard</strong>(инструмент, поставляемый вместе с Kubernetes).</p>
13 <p>Что касается пользователей контейнерных систем, то тут для мониторинга вполне подойдёт штатный<strong>Kubernetes Dashboard</strong>(инструмент, поставляемый вместе с Kubernetes).</p>
14 <p>На этом пока всё, успешного вам мониторинга!</p>
14 <p>На этом пока всё, успешного вам мониторинга!</p>
15 <p><em>Статья подготовлена по материалам блога<a>MCS.Mail.ru</a>.</em></p>
15 <p><em>Статья подготовлена по материалам блога<a>MCS.Mail.ru</a>.</em></p>
16  
16