Автоматический мониторинг журнала событий и обнаружение потенциальных неполадок
Постоянный мониторинг журналов событий Windows должен быть неотъемлемой частью любого плана управления сетью. В сущности, журналы необходимо анализировать каждый день и реагировать на важные события немедленно. К сожалению, сетевые администраторы перегружены и часто не имеют времени для проверки журналов, в результате чего происходят сбои в работе сетей.
Режим финансовой экономии, сокращение штата и требование руководства делать больше с меньшими затратами приводят к радикальным изменениям в информационной среде предприятия. Сетевым администраторам требуются более эффективные инструменты. Например, если есть время для регулярного просмотра журналов событий, то полезно принимать профилактические меры. Инструменты, представленные в данном обзоре, помогут управлять журналами событий и в конечном итоге работать более продуктивно.
Когда происходит то или иное событие, инструменты мониторинга журнала событий операционной системы выдают предупреждение на пейджер, по электронной почте, через всплывающее окно или сервер Microsoft Systems Management Server (SMS). Методы оповещения лучших продуктов отличаются гибкостью, и администратор может получать предупреждение о важнейших событиях на пейджер, а о менее критичных — по электронной почте или иным способом. Вряд ли администратору нужно знать об успешном выполнении задания на печать, но сообщение о внезапном отказе службы Microsoft Exchange Server Store Service должно быть доставлено незамедлительно. Следует выбирать инструменты, в которых можно распределить оповещения по типу события, категории и ключевым словам.
Анализ закономерностей — необходимая диагностическая функция. Она позволяет выяснить, происходило ли данное событие раньше. Прошлые события можно обнаружить с помощью фильтров утилиты Event Viewer, но эти события часто оказываются перезаписанными, и их предыстория теряется. Инструмент должен автоматически сохранять события для последующего анализа. Располагая функцией поиска закономерностей, можно использовать в качестве диагностического средства утилиту, определяющую временной интервал между конкретными событиями. Например, анализ промежутков времени между регулярными событиями Active Directory (AD) облегчит диагностику AD и других ошибок, связанных с синхронизацией. Иногда интервал между ошибками синхронизации превышает 24 часа, и поэтому обнаружить их трудно.
Еще одна полезная функция — аннотирование журнала событий. Благодаря этой функции администраторам не придется «изобретать велосипед» для обнаружения похожих событий в будущем. Можно просто обратиться к истории и быстро устранить повторяющуюся неисправность с помощью ранее найденного решения.
Инструменты мониторинга журналов событий, представленные в данном обзоре, особенно полезны для администраторов, управляющих большим количеством серверов, соединенных сетью WAN. С их помощью можно получать оповещения о событиях и принимать соответствующие меры еще до того, как возникнут серьезные проблемы. В идеальном случае инструменты не требуется устанавливать на каждом сервере, но режим установки зависит от конкретного продукта.
Выбирая инструмент мониторинга журналов событий операционной системы, следует убедиться в возможности дистанционного доступа к серверам через безопасный канал. В этом случае многие неполадки можно устранить дистанционно или хотя бы принять временные меры до личного визита в офис. Служба Windows 2000 Server Terminal Services, работающая на сервере Windows Server 2003 или Windows 2000 в режиме Administrator Mode, представляет собой эффективное решение для дистанционного управления.
Все продукты в данном обзоре обеспечивают просмотр событий с использованием модели «управления исключением» (Management by Exception), и администратор может назначать предупреждения о важнейших событиях, которые могут привести к сбою сервера или нарушению работы сети. Выбранный продукт должен отвечать требованиям конкретного предприятия. Одни инструменты предназначены только для мониторинга событий, другие располагают полным набором сетевых функций управления. Эти инструменты могут существенно повысить эффективность работы администратора, так как позволяют постоянно контролировать состояние сети.
Алан Сугано ( asugano@adscon.com) — президент фирмы ADS Consulting Group, специализирующейся на сетевых технологиях, программировании, проектировании на базе Microsoft .NET и SQL Server