IV. Системы управления международных сетей
Продолжение. Начало в CW-R ##20, 26
Александр КрейнесМы потратили уже довольно много времени и драгоценной газетной площади, рассуждая о международных сетях. Цель наших разговоров - прежняя: показать, каким образом глобальный масштаб международных сетей влияет на подходы к их проектированию и меняет приоритеты в использовании технических средств для обеспечения обмена информацией.
Сегодня мы поговорим о средствах управления и диагностики в международных сетях. В этой области существуют несколько проблем, и все они имеют определенную специфику, связанную именно с масштабами международных сетей и дороговизной линий связи для передачи информации. Проблема номер один - дистанционное управление работой сети, диагностика неисправностей и (возможно) их устранение. Проблема номер два (связанная с первой) - оптимальное распределение интеллектуальных средств управления по сети. Проблема номер три - оптимальное распределение технического и обслуживающего персонала.
Сформулируем проблему более развернуто. Каким образом осуществлять управление работой сети в целом? Как собирать информацию о трафике, анализировать использование протоколов? Кто, где и какими средствами будет это делать? Имеет ли смысл держать высококвалифицированный (и весьма высоко оплачиваемый) технический персонал в каждом филиале компании, а если нет - то каким образом выяснить причины неполадок до выезда на место? С локальными вычислительными сетями этих проблем либо не бывает, либо они решаются достаточно просто. Разумеется, в каждой крупной организации есть свой отдел информационных технологий (или как он там называется), а каждая мелкая организация легко может пригласить технических специалистов из сторонней организации. Разумеется, сбор информации о работе сети проводится SNМР-агентами, которые передают свои данные на компьютер, где установлено приложение управления сетью. Конечно, администратор системы может знакомиться с полученными данными, анализировать их, выявлять узкие места в работе сети, определять источники максимальной нагрузки на сеть и принимать все необходимые меры.
А в международной сети? Чем дальше управляющий компьютер от точки сбора информации, тем дороже стоит передача данных от агента к приложению управления. В удаленном филиале компаний может работать всего несколько сотрудников, и специально нанимать технических работников для обслуживания оборудования может быть накладно. Именно здесь мы и сталкиваемся с вышеупомянутой спецификой международных сетей, обусловленной их глобальным масштабом. Рассмотрим несколько способов выхода из положения.
Прежде всего, средства управления сетью и диагностики неисправностей. Здесь можно сформулировать целый ряд требований к аппаратному и программному обеспечению, выполнение которых крайне желательно для эффективного функционирования международной сети. Во-первых, приходится очень жестко ограничивать объем управляющей информации, передаваемой по сети. Чтобы при этом не упала ее управляемость, частичный анализ собираемой статистики надо выполнять непосредственно на месте сбора данных. Администратор сети должен получать сигналы только о ситуациях, требующих его прямого вмешательства. Решение этой задачи выходит за рамки SNMP для ее решения применяется технология дистанционного мониторинга (remote monitoring, RMON). Конечно, правильное определение условий подачи аварийных сигналов - своего рода искусство; это означает, что для эксплуатации международных сетей персонал должен иметь значительно более высокую квалификацию, чем для управления локальными вычислительными сетями. Кроме того, удаленное управление работой сети требует также использования только такого оборудования, которое можно полностью конфигурировать в программном режиме - представьте, каково посылать технического специалиста за тысячу верст лишь с тем, чтобы поменять положение одного переключателя.
С задачей дистанционного управления сетью тесно связана задача дистанционной диагностики отказов и их устранения. Во-первых, прежде, чем отправляться в командировку, технический сотрудник должен убедиться, что его присутствие на месте действительно необходимо. В частности, надо выяснить, не связано ли возникновение отказа, например, со случайным отключением какого-либо устройства или соединительного кабеля. Очень важно также правильно определить, чем вызвана проблема - неисправностью оборудования или повышением уровня шумов в линии. Если же удалось выяснить, что отказ в работе сети точно связан с неисправностью оборудования - полезно разобраться, какое именно оборудование отказало и заранее связаться с компанией, осуществляющей техническое обслуживание этого оборудования (проконсультироваться, запросить запасные части и т.д.).
Все это, конечно, легче произнести, чем сделать, однако современные средства анализа работы сети обеспечивают решение упомянутых задач. Перечислим некоторые из таких средств. Во-первых, существуют средства, передающие по линиям связи состояние световых индикаторов на передней панели устройства. Благодаря этому, технический сотрудник может сразу увидеть, не отключено ли какое-либо устройство и не выдает ли, например, какой-нибудь модем сигнал "NO CARRIER". Более сложные неисправности требуют и более серьезных средств борьбы. Проверка частоты возникновения ошибок при передаче данных, выполненная в дистанционном режиме, позволит судить о качестве линии. Информация о фактическом пути установления соединения или передаче пакетов данных даст возможность определить предполагаемые места возникновения заторов. Статистика времени задержек при передаче позволит определить узкие места. Неожиданное увеличение времени задержки при передаче данных может свидетельствовать об отказе части оборудования, не ведущем к полной остановке сети - тем самым, возможно, удастся предотвратить полный отказ, заменив неисправное оборудование. Существуют и разветвленные средства анализа протоколов в дистанционном режиме, без выезда на место.
Еще один очень важный момент организации международных сетей, имеющий непосредственное отношение к управлению сетями - оптимальное распределение интеллекта в сети. Как уже говорилось выше, в локальных вычислительных сетях используется централизованная схема управления. С другой стороны, возможная распределенная схема управления, когда решения по части управления работой сетью принимаются на каждом узле самостоятельно. В каждом конкретном случае используется своя схема управления ее выбор полностью определяется спецификой данной сети. Не вдаваясь в подробности, поясним в самых общих чертах, с чем связана сама необходимость такого выбора схемы в международной сети.
Централизованная схема управления, когда все решения по управлению принимаются на одном сервере, бесспорно гораздо проще с точки зрения программного обеспечения и синхронизации. Вся информация для принятия решений хранится в одном месте, поэтому ее существенно легче проанализировать. С другой стороны, при работе по централизованной схеме передача информации для принятия решений "забивает" драгоценные каналы связи и приводит к снижению эффективной пропускной способности по данным. Кроме того, один централизованный сервер может не справляться с обработкой колоссального потока информации в часы пиковой нагрузки на сеть. Это приведет к задержкам в передаче информации, не говоря уже о том, что отказ такого сервера вызовет полную остановку сети. Отсюда следует тенденция к рассредоточению управляющего интеллекта по сети. Как правило, современные международные сети тяготеют к использованию распределенной схемы - часто в виде нескольких (региональных) серверов: такая схема позволяет сокращать затраты на передачу управляющей информации и обеспечивать необходимую отказоустойчивость. При этом сам процесс управления сетью оказывается все же проще (а следовательно, и дешевле), чем при использовании распределенной схемы, так сказать, в чистом виде.