|
|
|
Система мониторинга Zabbix
Для всех клиентов, которые приобретают услугу технической поддержки, мы предоставляем бесплатный аккаунт на собственном внешнем Zabbix сервере с возможностью индивидуальной настройки собираемой статистики и оповещений.
Рассмотрим типичные параметры мониторинга:
- Свободное место на носителях информации - исчерпание свободного места на разделе жесткого диска может привести как к частичной неработоспособности сайтов (нет места для хранения временных данных, сессий), так и к необратимому повреждению баз данных. Исчерпание места на устройстве хранения резервных копий может привести к тому, что в нужный момент имеющиеся бэкапы окажутся устаревшими, поврежденными или неполными. Система мониторинга следит за объемом свободного пространства и предупредит, когда объем будет менее фиксированной (или относительной в процентах) величины.
- Целостность оборудования - обычной практикой при эксплуатации сервера является объединение нескольких жестких дисков в дисковый массив. Однако, отказ одного из дисков очень часто остается долго незамеченным, а результат выхода из строя второго диска оказывается плачевным. Система мониторинга периодически проверяет режим работы дискового массива и оповещает в случае его перехода в состояние деградации.
- Использование системных ресурсов - резкое изменение потребления памяти, процессорного времени, скорости передачи данных может свидетельствовать о возникновении нештатной ситуации - атака типа DoS, всплеск посетителей на сайте спортивной тематики во время футбольного матча, блокировка базы данных... Zabbix может отслеживать и реагировать как на текущее значение измеряемой величины, так и на скорость ее изменения за промежуток времени.
- Соблюдение SLA - рано или поздно зрелые проекты приходят к необходимости контроля качества предоставляемых услуг. В качестве простейшего примера можно привести требования вида: "При нагрузке в 500 запросов в секунду, 90% запросов должны выполняться менее чем за 300 ms, 99% менее чем за 500 ms, количество отказов (HTTP 5xx) не более 0.1%". После задания критериев оценки система мониторинга будет отслеживать их соблюдение.
При возникновении нештатной ситуации система мониторинга может оповестить всех заинтересованных лиц (и в первую очередь администратора) по одному или нескольким каналам связи: e-mail, jabber, sms. Гибкость настройки оповещений позволяет ранжировать события и способ оповещения по важности (например, оповещать только в критических ситуациях), времени суток (не отсылать sms с 23 до 9 часов утра), длительности проблемы (в случае нерешения проблемы за определенный срок оповестить вышестоящего человека).
Для работы системы на сервере устанавливается и настраивается zabbix agent, который потребляет незначительное количество системных ресурсов, собирает требуемые данные и отсылает их на центральный сервер.
Кроме этого, система позволяет собирать вторичные данные, формировать графические и текстовые отчеты с примерами которых можно ознакомиться на сайте производителя.
|