Неблагоприятные воздействия техногенного, природного, социального или криминального характера могут привести к отказам в обслуживании пользователей телекоммуникационных услуг. Временные перебои с доступностью услуг могут возникать в результате повреждений и разрушений технических средств либо программных компонентов инфраструктуры операторов и сервис-провайдеров. За примерами далеко ходить не нужно – достаточно вспомнить катастрофические последствия недавнего землетрясения в Японии (когда в мегаполисах этой страны исчезла столь необходимая в тот момент сотовая связь) или знаменитый пожар (и его последствия для столичных сетей связи) на электрической подстанции Чагино в мае 2005 года. Меж тем для потребителя нет разницы, из-за чего он перестанет получать оплаченные коммуникационные услуги. Поэтому возникает правомерный вопрос к поставщикам услуг и инфраструктурных продуктов: что предпринимается для повышения «живучести» сетей связи и какие меры предусмотрены для их восстановления после сбоев?
Анализируя комментарии специалистов на эту тему, нетрудно убедиться, что с технологической точки зрения бесперебойная работа систем связи – задача вполне выполнимая. Для этого применяются и зарекомендовавшие себя схемы резервирования, и более интеллектуальные методы обеспечения непрерывности бизнеса. В первую очередь это касается вычислительного оборудования и главных информационных систем сервис-провайдеров.
«Для операторов связи доступность и бесперебойность работы информационных систем имеют ключевое значение. Система считается высокодоступной, если время ее простоя не превышает нескольких минут в год. Но для критически важных систем и этого бывает недостаточно. Такие системы должны работать 24 часа 7 дней в неделю», — замечает Андрей Щеголь, руководитель проектов корпорации Symantec в России и СНГ. Простейшим решением задачи бесперебойной работы может служить полное резервирование ИТ-систем. Однако размещение всех систем по принципу стопроцентного резервирования, например, в резервных дата-центрах оператора, а также синхронная репликация всех данных обойдутся слишком дорого; здесь нужен более разумных подход, полагает Щеголь.
Например, для одного их крупнейших российских сотовых операторов Symantec провела специальную инвентаризацию – Data Classification Assessment, в ходе которой все данные и системы компании были подвержены классификации по степени критичности для бизнеса и для каждого класса установлены свои политики защиты. В результате системы высшего приоритета (например, биллинг) резервировались по принципу «1:1» в удаленном ЦОД, а для поддержания доступности менее важных систем были задействованы меньшие ресурсы. Такой подход позволил оптимизировать расходы и повысить бесперебойность работы критичных информационных систем оператора.
Говоря об обеспечении непрерывности бизнеса, нельзя оставить без внимания тему резервного копирования и аварийного восстановления данных ИТ-систем. Основная тенденция заключается в том, что компании связи все больше используют виртуальные среды, поэтому в решениях поставщиков информационных систем особое внимание сейчас уделяется именно этой функциональности. К примеру, новая версия решения Symantec NetBackup позволяет ускорить резервное копирование в виртуальных средах в полтора раза. В итоге риск потери важных данных или недоступности сервиса значительно снижается, подчеркивает руководитель проектов Symantec.
Что касается защиты от неблагоприятных факторов собственно сетевого оборудования, предназначенного для монтажа на открытой местности, то оно производится в специальных контейнерах. Эти контейнеры обеспечивают защиту как от неблагоприятных погодных условий, так и от физических воздействий; контейнеры также оборудованы системами резервного электропитания и тревожной сигнализацией, отмечает Алексей Коняев, руководитель направления по работе с корпоративными заказчиками APC by Schneider Electric, направление «Телеком».
Электроснабжение, как нетрудно догадаться, – «ахиллесова пята» любой системы связи. По мнению Коняева, российские операторы уделяют достаточно внимания вопросам бесперебойного электропитания своих технологических систем: «Я работаю довольно давно с нашими операторами связи и общаюсь с коллегами по продажам оборудования в других областях экономики, а поэтому уверенно могу сказать, что связисты, как никто другой, понимают необходимость бесперебойной работы телекоммуникационных узлов. Причем принцип бесперебойного электропитания затрагивает все основные сетевые элементы, начиная от коммутатора и заканчивая базовой станцией, а иногда и конечным терминалом (в случае такой необходимости)».
Одновременно Коняев замечает: «Невозможно гарантировать защиту от всех рисков, иначе строительство узла связи будет обходиться очень дорого, что непременно скажется на стоимости услуг для абонентов. Как показывают последние события в Японии, силу природного явления предугадать можно, но предвидеть все его последствия очень сложно».
Сами же операторы рапортуют о готовности к нестандартным ситуациям. К примеру, в «Акадо Телеком» - у одного из крупнейших кабельных операторов российской столицы - реализован целый комплекс мер по противодействию угрозам для сетевой инфраструктуры и установленному качеству услуг. Как сообщил Вадим Ваньков, заместитель генерального директора по коммерческой деятельности ОАО "КОМКОР" (торговая марка "Акадо Телеком"), этот комплекс включает в себя множество аспектов: применение надежных технических решений, резервирование ключевых участков сети и оборудования, постоянный мониторинг всех узлов и элементов инфраструктуры, наличие регламентов действий должностных лиц в различных штатных и нештатных ситуациях, автоматизированный учет инцидентов и контроль их устранения, наличие системы менеджмента качества в соответствии с требованиями ГОСТ Р ИСО 9001 и ряд других.
По словам Ванькова, управление сетями и процессами в компании осуществляется из единого центра во взаимодействии с круглосуточной службой технической поддержки. Сети SDH, DWDM, MPLS, кабельного телевидения и узлы инженерной инфраструктуры (электропитание, климатика и пр.) оснащены системами управления и мониторинга, посредством которых осуществляется контроль за работой всех сетевых элементов, каналов связи, сбор и обработка сервисных и аварийных сообщений, диагностика и тестирование. Такой подход позволяет локализовывать и устранять неисправности оборудования в минимальные сроки. Аварийные и сервисные сообщения от всех систем поступают в единую информационную систему ИСУН (интегрированная система управления неисправностями). Все процессы эксплуатации и аварийно-восстановительных работ четко регламентированы. А система гарантированного электропитания обеспечивает контроль наличия внешнего электропитания, разряда аккумуляторов и уровня температуры на узлах сети «Акадо Телеком».
Для восстановления телекоммуникационных систем после сбоев в компании предусмотрены резервные каналы, в обязательном порядке производится резервное копирование не только данных, но и конфигураций системного ПО. Сеть «Акадо Телеком» имеет отказоустойчивую кольцевую топологию. К примеру, по сети осуществляется трансляция телевизионных сигналов более 200 каналов через головную телевизионную станцию. Однако существует и резервная система. Таким образом, ни повреждение участков кабельных сетей, ни выход из строя систем головной станции не приведет к остановке работы сервиса, уверяет Ваньков.
У лидера российского сотового рынка МТС тоже имеется план по предупреждению чрезвычайных ситуаций и ликвидации их последствий. Как сообщил Алексей Завьялов, начальник отдела Центра оперативного управления сетью департамента мониторинга и управления сети МТС, компания совместно с Минкомсвязи регулярно проводит выездные совещания и учения, моделирующие чрезвычайные ситуации природного и техногенного характера. Разработанный по итогам учений план действий предусматривает мероприятия по защите персонала и оборудования, а также оперативное взаимодействие с МЧС и органами власти при возникновении различного вида угроз. С МЧС России заключено специальное соглашение «О сотрудничестве в организации оповещения населения о чрезвычайных ситуациях и в области безопасности жизнедеятельности по сетям подвижной радиотелефонной связи». Для оповещения абонентов компания сотрудничает с ведущим в России и СНГ контент- и сервис-провайдером «Информ-мобил».
Кроме того, МТС имеет действующее соглашение с Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций. Этот документ регламентирует взаимодействие и обмен информацией между сторонами при возникновении аварийных и чрезвычайных ситуаций.
Для повышения живучести своей телекоммуникационной инфраструктуры МТС строит и проектирует сети с учетом резервирования основных элементов. Например, транспортная архитектура выстраивается таким образом, чтобы линии связи имели пространственное разнесение, проходили в разных кабельных коллекторах. Для оперативного дублирования объектов сетевой инфраструктуры МТС располагает передвижными базовыми станциями. С конца марта 2011 года их число в регионах России увеличится на 14 единиц. Со всеми поставщиками и производителями оборудования у оператора заключены договоры на техническую поддержку. Для бесперебойного электроснабжения все объекты связи оснащены аккумуляторными батареями, а наиболее важные – вдобавок и стационарными дизель-генераторными установками.
На случай ЧС в распоряжении аварийных бригад МТС имеется весь необходимый инструментарий для оперативного реагирования: запчасти, инструменты и автомобили повышенной проходимости. Для некоторых труднодоступных регионов у аварийных бригад есть снегоходы и вездеходы. Также имеются передвижные генераторы, установленные в теплозащитном кожухе для надежного запуска в холода.
В периоды запланированных и незапланированных пиковых нагрузок на сеть МТС задействует уже хорошо отработанный механизм: для снижения нагрузки на линии сигнализации изменяются некоторые параметры сети, отменяются маркетинговые SMS-рассылки и отключаются некоторые дополнительные услуги, такие как «Вам звонили», «Я на связи» или подтверждение доставки SMS.
Что же, крупные операторы, такие как МТС и «Акадо», действительно способны организовать пусть и дорогостоящую, но эффективную систему бесперебойного предоставления телекоммуникационных услуг. А как обстоит дело с игроками меньшего масштаба, ориентированными на определенный сегмент пользователей? Выясняется, что и здесь этим вопросам уделяется достаточно внимания.
В частности, компания «Манго Телеком», специализирующаяся на обслуживании корпоративных абонентов, для диверсификации собственных рисков имеет «стык» со многими операторами связи, а также оборудование и технологии, способные в короткий срок произвести переключение на резервные каналы связи и восстановить предоставление услуг клиентам любого масштаба.
«На данный момент у нас существует уникальная кластерная система коммутаторов собственной разработки, которая позволяет минимизировать риски от аппаратных сбоев. Также наши специалисты постоянно обеспечивают избыточность телекоммуникационных ресурсов», — говорит Александр Трошин, технический директор «Манго Телеком».
Кроме того, сеть компании соединена с ТфОП 100 каналами Е1, емкости которых с избытком хватает для пропуска «пикового» трафика. Недавно «Манго Телеком» увеличила число соединительных линий московского сегмента сети с ТфОП еще на 25%, что как раз гарантирует им постоянную избыточную емкость, а пользователям – сохранение привычного качества обслуживания даже при резком увеличении пикового объема потребляемых услуг.
Итак, наше импровизированное исследование подтверждает высокую заинтересованность операторов в бесперебойном обеспечении услугами своих абонентов. Другой очевидный вывод: компании связи и поставщики инфраструктурных решений прикладывают к достижению указанной цели значительные усилия. Адекватны ли эти усилия потенциальным угрозам, может выясниться только в случае возникновения чрезвычайной ситуации. Но лучше бы, конечно, чтобы этот «паровоз» непрерывности бизнеса как можно дольше оставался «на запасном пути».