Для поиска ошибок в сети используются специальные измерительные инструменты —от тестеров линий до протокольных анализаторов. Последние все в большей степени превращаются из инструмента диагностики ошибок в систему мониторинга на сетевом уровне, с помощью которой пользователь может своевременно выявить назревающую проблему и устранить ее, а кроме того, проверить новые приложения в имитационном режиме перед их внедрением.

При возникновении ошибки в сети администратор в первую очередь пытается выяснить возможные причины и найти отказавшие компоненты с помощью тестера линии с функцией эхотестирования (ping). Если этого оказывается недостаточно, то он предпринимает детальное расследование при помощи протокольного анализатора. В коммутируемых сетях ему приходится обследовать каждый сегмент, а ошибки часто проявляются спорадически, поэтому для их анализа необходим доступ к записанным сетевым данным.

Эти данные поступают в том числе и из системы мониторинга, которая регулярно опрашивает статус подключенных сетевых компонентов, например посредством SNMP и RMON. Кроме того, администратор стремится выявить действительные и потенциальные отказы компонентов (возможно, из-за перегрева). Однако понятие мониторинга может быть расширено: некоторые производители предлагают специальные коммутационные панели, с помощью которых могут быть выявлены ошибки на физическом уровне путем мониторинга портов. Уже многие годы на рынке присутствуют системы мониторинга для более высоких уровней модели OSI вплоть до уровня приложений. При этом речь, как правило, идет о мониторинге производительности приложений в сети (см. Рисунок 1). С помощью таких систем администратор может оптимизировать распределение нагрузки и избежать возникновения узких мест в сети.

Рисунок 1. Системы мониторинга производительности исследуют реакцию или, как в данном случае Superagent, следят за средним временем цикла приложений, серверов, сетевых соединений и конечных устройств.

Некоторые системы охватывают не только все распространенные топологии локальных и глобальных сетей, но и анализируют сетевые данные на всех семи уровнях OSI, включая статистику канального уровня, нагрузку и анализ протоколов. Они позволяют выполнять мониторинг приложений и сети, результаты которого могут быть использованы для планирования производительности, поиска и устранения ошибок и получения ценных данных для управления семиуровневой моделью или моделирования сети. Речь идет о таких системах, как Spectrum от A-Prisma, Vantage от Compuware, Superagent от Fluke (продукт OEM от Netqos), Ngenius от Netscout, Packetseeker от Packeteer, The Guard от Realtech и Network Node Manager от Hewlett-Packard.

РАСПРЕДЕЛЕННЫЙ ПРОТОКОЛЬНЫЙ АНАЛИЗ

В схожем направлении развиваются распределенные системы всех наиболее распространенных протокольных анализаторов: в целях профилактики они регистрируют сетевой трафик в самых важных сетевых узлах, предоставляют статистику нагрузки и необычных событий и подают сигнал тревоги в случае события, оцененного как ошибка. Эти системы мониторинга сетей предусматривают детальный анализ протоколов. Благодаря им администратор в состоянии отреагировать уже на первые предупреждения и предотвратить возникновение отказа. События делятся на различные группы по степени риска и неотложности, которые система соответствующим образом отображает. При поступлении какого-либо события у администратора есть возможность обратиться к экспертной системе, чтобы выяснить причину происходящего и методы борьбы.

К наиболее известным решениям, наряду с системами Sniffer от Network Associates (а также Network General и McAfee, когда будет завершено приобретение продуктов для прослушивания сети Silver Lake Partners и Texas Pacific Group), относятся Observer от Network Instruments, Network Analizer от Agilent, Surveyor от Finisar (ранее Shomiti), решения Etherpeek и Omni3 компании Wild Packets или Optiview Analyzer от Fluke (программное обеспечение изначально принадлежало Finisar). Тем, кто хотел бы делать записи в продолжение длительного срока (до нескольких дней), следует поподробнее познакомиться с системой старшего класса NetVCR, которую предлагает Niksun.

Как правило, системы анализа протоколов имеют модульную структуру и предлагают решения для различных топологий — от Ethernet и беспроводных сетей до сетей хранения данных и глобальных сетей и помогают отыскивать ошибки даже в соединениях виртуальных локальных сетей. По большей части они содержат распределенные программные и аппаратные анализаторы, а также зонды для передачи отфильтрованного трафика дальше на центральную консоль (см. Рисунок 2). В состав системы нередко входят агенты SNMP. Подключение устройства к сети осуществляется посредством зеркального порта или разветвителя трафика, причем в случае зеркального порта отброшенные коммутатором пакеты (первого и второго уровня) не могут быть получены, а запись полнодуплексного канала невозможно выполнить без потерь.

На первый взгляд функциональность идентична почти у всех решений. Различия заключаются в интерфейсе и удобстве обслуживания. Так, не всегда переход от анализа данных к соответствующей записи (данные измерений) осуществляется щелчком мыши. Кроме того, не каждое решение поддерживает все топологии и семейства протоколов. Системы отличаются скоростью и объемом записи данных измерений, что приобретает особое значение в случае Gigabit Ethernet.

GIGABIT ETHERNET

Для анализа в сетях Gigabit Ethernet производители классических программных решений сами разрабатывали аппаратные варианты своих протокольных анализаторов, поскольку в случае спорадически возникающих отказов необходима запись полного сетевого трафика. Так, если сбой проявится во время процесса резервного копирования данных на магистрали Gigabit Ethernet, то это, как правило, означает высокую загруженность соединения. Тем не менее анализатор должен без потерь записывать данные и быстро переписывать их, к примеру, на диски SCSI, чтобы информация о создающем помехи событии была гарантированно сохранена. Поэтому при выборе решения для тестирования Gigabit Ethernet очень важно, на какие нагрузки рассчитывает администратор и может ли система достаточно быстро записывать данные о трафике в обоих направлениях. Механизмы оперативной фильтрации обеспечивают более умеренный поток данных. Однако для выяснения причины помех необходима запись всех пакетов данных в соответствующем временном интервале.

ОБРАБОТКА ДАННЫХ

Недостаток анализа протоколов заключается в сложности оценки, когда, например, пользователь заявляет о замедлении работы его компьютера. В этом случае исходные данные могут предоставить экспертные системы. Однако пользователь анализатора протоколов должен очень хорошо знать особенности работы своей сети, какие события от каких протоколов зависят и как это влияет на подключенные компоненты, серверы, конечные устройства и приложения. При поиске ошибок важно понять, какие изменения имели место в сети в момент отказа или незадолго до него. Возможно, в это время проводились работы по обслуживанию, обновление программного обеспечения или установка новых устройств? В беспроводных локальных сетях или сетях хранения данных до сих пор не все устройства различных производителей взаимодействуют друг с другом без проблем.

Чем же поможет администратору подробная запись сетевого трафика, если он не сумеет интерпретировать результат, а информация о событии и указания экспертной системы не дадут ему никаких ключей к ответу? По крайней мере, у него есть возможность воспользоваться услугами эксперта, обладающего опытом поиска ошибок и способного обращаться с записанными сетевыми данными. Это сэкономит ценное время при локализации неисправностей.

ПОЛНОЕ ПОКРЫТИЕ

Еще один недостаток подобных систем заключается в том, что в большинстве случаев они инсталлируются только на важных сетевых узлах, а произошедшая в другом сегменте сети ошибка должна распространиться до наблюдаемого сегмента, и лишь тогда система сможет зафиксировать случившееся. Однако в таком случае ошибка окажется уже настолько далеко от своего источника, что выяснить причину будет весьма сложно. Поэтому администратору необходимо реагировать сразу, как только пользователь заявляет о проблемах. Немедленный запрос позволит ему получить точное время и описание отказа, что упростит поиск ошибки. А кроме того, он может установить на пострадавший компьютер в неконтролируемый сетевой сегмент — где в большинстве случаев нет соединений Gigabit Ethernet — программного агента и таким образом при повторном отказе получить конкретную информацию.

ДОПОЛНИТЕЛЬНЫЕ ФУНКЦИИ

В случае некоторых анализаторов, в частности Sniffer и Observer, у администратора есть возможность использовать их в качестве резерва систем обнаружения вторжения, поскольку экспертное программное обеспечение регулярно снабжается обновленной информацией обо всех попытках типовых атак. Они отфильтровывают свойственные нападениям шаблоны пакетов или выдают сигнал тревоги, когда от одной машины неожиданно поступает слишком много трафика.

Система NetVCR от Niksun может быть использована вместе с генератором трафика — полезное дополнение при введении новых приложений и в случае миграций. Ответственный за сеть сначала производит анализ типового сетевого трафика на критических узлах, после чего воспроизводит на некоторых рабочих станциях измененный трафик от нового приложения и при помощи распределенных анализаторов выясняет, как это отразится на поведении сети. Таким образом распознаются возможные отказы, которые легче устранить в самом начале миграции.

Тем, у кого регулярно возникают проблемы с сетью Windows, причину отказа поможет выяснить экспертная система Tracemagic от Synapse Networks. База данных этого продукта постоянно обновляется; кроме того, в него могут быть введены специфичные причины ошибок пользовательской сети.

ПОСТАВЩИКИ УСЛУГ

Измерительная техника на протокольном уровне — дело экспертов, а сети, оснащенные беспроводными сегментами и подключениями к глобальной сети, становятся все сложнее, поэтому начали появляться и поставщики услуг в этой области. Они не только оказывают помощь в случае отказа, но и предлагают обучение продуктам и сетям или в процессе реализации какого-либо проекта инструктируют администратора об особенностях соответствующего измерительного и сетевого оборудования.

Дорис Беренд — редактор LANline. С ней можно связаться по адресу: db@lanline.awi.de.


? AWi Verlag