Аудит серверов

Linux-Аудит
Аудит для Linux серверов,первые 5 минут помощи.
Обратите внимание на теоретическое формирование проблем.

Не спешите бросаться на сервера, сперва нужно выяснить, что уже известно о системе и специфике проблемы. Не стоит тратить время на поиск проблемы вслепую. Несколько обязательных вопросов, требующих ответа:

Какие конкретно наблюдаются симптомы? Подвисания? Ошибки? Когда проблема была замечена впервые? Воспроизводится ли она? Есть ли закономерность (например, происходит каждый час)? Какие были последние изменения в системе (код, сервисы, стек приложений)? Влияет ли проблема на определенную группу пользователей (авторизированных, не авторизированных, с общим географическим расположением...)? Имеется ли документация на архитектуру (физическую и логическую)? Используется ли система мониторинга? Munin, Zabbix, Nagios, New Relic...

Ведется ли (централизированное) журналирование? Loggly, Airbrake, Graylog.. Последние два пункта представляют собой наиболее удобные источники информации, но не возлагайте на них больших надежд: как ни печально, именно мониторинг и журналирование часто отсутствуют. Если не повезло, сделайте заметку, что это нужно поправить, и двигайтесь дальше.

* Прочитать PDF документ

После этих первых пяти минут (плюс-минус десять), у вас должно будет сформироваться более полное понимание ситуации: Что запущено. Связана ли проблема с вводом-выводом/аппаратной частью/сетевой подсистемой или конфигурацией (плохой код, настройки ядра, ...).

Есть ли знакомые шаблоны: плохое использование индексов БД, слишком много процессов apache, и т.п. Вы даже могли уже найти непосредственную причину проблемы. Если нет, то вы находитесь в хорошей позиции для дальнейших поисков, зная, что все очевидное уже проверено.


 

Последние материалы