Предприятиям чрезвычайно важно, чтобы соединения глобальной сети функционировали без сбоев и отказов. Специализированные измерительные и аналитические инструменты позволяют быстро реагировать на возникающие ошибки, но, кроме того, они часто применяются и для постоянного мониторинга соединений глобальной сети. А оптимальное планирование пропускной способности поможет добиться немалой экономии.
Преимущества анализа трафика в корпоративной сети широко известны: без протокольного анализатора, следящего за процессами в сети, невозможно идентифицировать проблемы с локальной сетью и безопасностью, а значит, требования предприятия не будут удовлетворены в полной мере. Похожий анализ трафика данных в глобальных сетях (Wide Area Network, WAN) менее известен. Вполне правомерен вопрос о том, что же приносят инвестиции в аппаратные и программные решения для сбора и анализа пакетов в глобальной сети. Это зависит от значимости глобальной сети для предприятия: если ее оптимальная готовность необходима для поддержки деловых процессов (а обычно так оно и есть), то дополнительных вложений в соответствующий инструментарий для ее анализа не избежать.
Исследование глобальной сети нацелено на сбор пакетов и дешифровку кадров, в которых содержатся пакеты локальной сети. В результате удается не только устранить имеющиеся неполадки, но и выяснить, насколько провайдер придерживается оговоренных параметров пропускной способности и готовности, так как без протоколирования проблем в глобальной сети очень сложно предъявить претензии по поводу несоблюдения согласованного уровня обслуживания. Кроме того, анализ глобальной сети показывает реальный объем данных. Предотвращение появления узких мест путем опережающего прогнозирования пропускной способности в свою очередь позитивно отражается на готовности и планировании бюджета.
ПРОВЕРКА SLA
Поскольку широкополосные соединения глобальной сети дороги, в соглашении об уровне сервиса (Service Level Agreement, SLA), которое предприятие заключает со своим провайдером, определяются обязанности последнего. Однако SLA еще не является гарантией реального соблюдения обязательства. В соответствии с девизом «Доверяй, но проверяй» рекомендуется оценить параметры готовности, пропускной способности и времени задержки пакетов. В конце концов, не в интересах провайдера оповещать клиентов о том, что он не может предоставить оговоренные контрактом услуги, так что для их гарантированного получения требуется независимый контроль соединений глобальной сети.
Вопрос не в том, разорвано соединение или нет: такая ошибка очевидна, для ее обнаружения не нужен специальный инструмент для диагностики. Прежде всего речь идет о соблюдении гарантированной (контрактом) производительности. Согласованная скорость передачи информации (Committed Information Rate, CIR) определяет скорость передачи и готовность соединения глобальной сети. Кроме того, в подобных соглашениях могут задаваться граничные значения для числа потерянных кадров и прочие связанные с производительностью параметры.
Соглашения об уровне сервиса ставят вопрос о соответствии оговоренной скорости передачи данных реальной, а анализ глобальной сети позволяет контролировать выполнение этого условия. Не исключено, что сравнение полученных при измерении параметров с утвержденными в контракте CIR может стать причиной принятия неотложных мер с последующим заключением нового оптимизированного контракта на обслуживание.
ПРИНЦИП ФУНКЦИОНИРОВАНИЯ АНАЛИЗА ГЛОБАЛЬНОЙ СЕТИ
Для сбора кадров глобальной сети в той форме, какая необходима для тщательной проверки соглашений об уровне доступа, анализу должен подвергаться непосредственно трафик в канале глобальной сети. При этом копия потока данных поступает из канала через тестовую точку доступа (Test Access Point, TAP) на анализатор, где кадры расшифровываются и анализируются на канальном уровне модели OSI.
Для этого администратор должен разместить TAP между каналом глобальной сети и устройством обслуживания клиентов/устройством обслуживания данных (Customer Service Unit/Data Service Unit, CSU/DSU) и подключить его к выделенному аппаратному зонду глобальной сети или анализатору глобальной сети. Централизованное управление и мониторинг распределенных сетей требуют распределенного решения для анализа с зондами на каждом канале глобальной сети. Как пассивное устройство, ТАР никоим образом не влияет на сигнал глобальной сети между каналом и CSU/DSU, точно так же и трафик данных не пострадает, если ТАР окажется без питания.
СПЕЦИФИЧЕСКЙ АНАЛИЗ ГЛОБАЛЬНОЙ СЕТИ
Пакеты третьего уровня отображает и обычный протокольный анализатор. Какими же свойствами, отсутствующими у анализатора локальной сети, обладает специальный анализатор глобальной сети (см. также врезку «Измеряемые параметры при анализе глобальной сети»)? Он не только «видит» содержимое кадров глобальной сети, но и, кроме того, расшифровывает кадры глобальной сети на канальном уровне и показывает управляющие поля в заголовке кадра, где сохраняется информация о перегрузке канала в обоих направлениях. Анализатор глобальной сети позволяет выявить также проблемы с передачей, которые могут возникнуть в результате плохо выполненной проводки между CSU/ DSU и подключением к глобальной сети. Типовой анализатор локальной сети, напротив, не способен расшифровывать и анализировать модифицированные маршрутизатором и помещенные внутрь кадра глобальной сети пакеты.
Некоторые распространенные протоколы для глобальных сетей, например высокоуровневый протокол управления каналом (High-level Data Link Control, HDLC) или frame relay, используют специальный метод оповещения для управления перегрузкой. Если в заголовок протокола помещен бит явного уведомления получателя о перегрузке (Forward Explicit Congestion Notification, FECN), то это свидетельствует о нехватке в данный момент доступной пропускной способности в направлении к терминалу получателя. При получении FECN маршрутизатор отправляет назад бит явного уведомления отправителя о перегрузке (Backward Explicit Congestion Notification, BECN).
Рисунок 1. FECN И BECN указывают на нарушение оговоренной в контракте производительности. |
Одна только проверка FECN и BECN не дает информации о соблюдении или несоблюдении оговоренного уровня обслуживания (см. Рисунок 1). Поэтому анализатор должен сопоставить базовый трафик с возникшей перегрузкой. Если в канале присутствует слишком много указаний на перегрузку и используемая пропускная способность оказывается меньше CIR, то провайдеру услуг сложно будет найти отговорку. Анализ реальной пропускной способности помогает пользователю точнее оценивать свои будущие потребности и экономить в случае меньшей необходимой полосы.
Рисунок 2. Анализ соединения во времени в рамках анализа задержки в глобальной сети. |
На Рисунке 2 изображена сеть с потребностью в пропускной способности менее четверти от реально оплаченной по контракту CIR. По вертикальной оси откладывается реальная пропускная способность CIR в диапазоне от 0 до 200%, а по горизонтальной — время. Благодаря заключению нового контракта на SLA предприятие может сэкономить значительную сумму. Помимо анализа перегрузки с использованием FECN и BECN анализатор глобальной сети позволяет исследовать другие специфические проблемы передачи данных в глобальной сети, которые указывают на проблемы с проводкой. К ним относятся, в частности, ошибки в контрольных суммах циклического избыточного кода (Cyclical Redundancy Checksum, CRC), прерывания и ошибки остаточного бита (Residual Bit, Rbit).
Если в течение продолжительного времени сетевое соединение превышает оговоренную CIR, то предприятию-пользователю вовсе не обязательно переходить на более высокий уровень сервиса. Прежде всего следует проверить, почему превышается согласованная скорость. Проверка трафика Ethernet, к примеру, позволяет убедиться, что системы совместного использования файлов — Kazaa или прочие необязательные процессы — не загружают сеть.
МНОГОКАНАЛЬНЫЕ СОЕДИНЕНИЯ
Поскольку соединение глобальной сети критично для деловых процессов, предприятия все чаще делают выбор в пользу многоканальных соединений: они получают возможность распределять трафик между несколькими соединениями и обеспечить избыточность при помощи резервных каналов. Необходимость проверки корректной конфигурации нескольких каналов вкупе с их профилактическим контролем — еще один аргумент в пользу приобретения анализатора глобальной сети. При наличии нескольких каналов в глобальную сеть вероятность ошибки многократно возрастает, поскольку подобные соединения зависят не только от оборудования провайдера услуг, но и от используемых маршрутизаторов и мультиплексоров. При помощи анализатора глобальной сети администратор конфигурирует сигналы тревоги. Так, устройство автоматически показывает изменения в соответствующем канале из-за большого числа FECN/BECN — т. е. изменения, которые отрицательно влияют на услуги, но не на фиксированную CIR. Путем превентивного оповещения вовремя распознаются проблемы, диагностируются ухудшения работы служб и минимизируется время отказа.
ОБОБЩЕНИЕ
Анализатор глобальной сети дороже анализатора Ethernet, но дополнительные траты себя оправдывают: устройство проверяет оговоренные с провайдером услуг параметры производительности глобальной сети. Если условия соглашения не выполняются, то компенсационные выплаты быстро вернут инвестиции. Гарантированная пропускная способность снижает затраты.
Давид Эзер — руководитель отдела продаж Psiber Data. С ним можно связаться по адресу: wg@lanline.awi.de.
Измеряемые параметры при анализе глобальной сети
Необходимые для оценки глобальной сети анализируемые параметры частично можно получить при помощи анализатора локальной сети. Однако анализаторы глобальной сети проверяют и анализируют соглашения об уровне сервиса, статистику и проблемы за длительный период, а также случаи перегрузки каналов. Для оценки и поиска ошибок анализатор глобальной сети, состоящий, как правило, из аппаратной и программной частей, должен среди прочего иметь следующие функции:
- статистика — представление в реальном времени идентификаторов канального соединения (Data Link Connection Identifier, DLCI), частных виртуальных соединений (Private Virtual Circuit, PVC) или CIR. При этом оптимальным является представление потока данных в зависимости от времени для каждого канала и DLCI, а также процентное выражение CIR для каждого DLCI или PVC;
- ошибки — отображение ошибок в каждом канале глобальной сети, DLCI или PVC. Идеальным при этом является отображение ошибок из-за перегрузки (к примеру, FECN и BECN) в суммарном виде или в деталях, если условия CIR не выполняются;
- сбор/расшифровка пакетов — полный сбор пакетов с последующей расшифровкой пакетов глобальной сети. Фильтр записи данных, к примеру только трафика данных по DLCI или IP, позволяет проводить быстрый анализ возникающих в сети проблем. Для сбора и дешифровки необходимо специализированное аппаратное обеспечение с буфером соответствующих размеров (несколько гигабайтов);
- экспертная система реального времени — база данных для диагностики в реальном времени с предложением возможных решений упрощает поиск ошибок и тем самым повышает готовность сети. Отображение экспертных сообщений имеет смысл для представления критичных аномалий глобальной сети;
- анализ времени реакции на запросы в пределах соединения глобальной сети помогает сравнить два записанных потока данных на концах соединения, для чего служат соответствующие зонды или портативные анализаторы. Так можно проанализировать все соединение и измерить время задержки соединения глобальной сети. При больших временных задержках несложно сделать соответствующий вывод о качестве соединения;
- функция фильтрации обеспечивает быстрый поиск определенных пакетов или сетевых соединений. Весьма полезна производительная фильтрация данных в рамках анализатора (фильтрация до записи) и фильтрация уже записанных соединений (фильтрация после записи). Специальное аппаратное обеспечение с интегрированной фильтрацией данных позволяет проводить анализ соединений с высокой нагрузкой на сеть. Имеет смысл также логическое согласование фильтрации до и после записи;
- анализ долгосрочных тенденций изменения нагрузки на сеть за длительный промежуток времени выполняется посредством оценки предоставляемых анализатором данных мониторинга. Он облегчает оптимизацию сети для предполагаемых приложений. Кроме того, анализ тенденций предоставляет информацию для оптимизации CIR.