Только продуманная во всех деталях стратегия, учитывающая реальные риски, способна обеспечить стабильность бизнеса
Непрерывность бизнеса становится актуальной проблемой для многих российских компаний. Одно из свидетельств этого — значительный интерес, проявленный к семинару «Обеспечение бесперебойности бизнеса. Мировая практика», организованному в середине мая компаниями HP, Microsoft и «Ай-Теко», где обсуждалось не только собственно обеспечение стабильности работы ИТ-инфраструктуры, но и многие организационные вопросы, от решения которых зависит постоянная работоспособность предприятий.
Эдуард Оганов, заместитель генерального директора «Ай-Теко», отметил, что повышенный интерес к данной проблеме вызван стабилизацией экономической ситуации в нашей стране: «Прошли времена, когда использовались главным образом высоколиквидные активы и финансовые инструменты, а основным механизмом защиты бизнеса являлась своевременная ликвидация предприятий».
В настоящее время руководители обращают все больше внимания на стабильность работы своих компаний, в том числе в условиях возникновения чрезвычайных ситуаций. Это стало особенно актуально после трагических событий 11 сентября 2001 года в США, террористических актов в нашей стране, энергетической аварии в Москве и в условиях постоянно существующей угрозы техногенных катастроф.
Именно чрезвычайные события часто подталкивают топ-менеджмент компаний к необходимости разработки превентивных мер, повышающих эффективность шагов по преодолению нештатных ситуаций. В «Альфа-банке», к примеру, в свое время отказ работы системы SWIFT (сбой в программе произошел в штаб-квартире SWIFT в Брюсселе, и его не могли устранить в течение двух дней) стимулировал внедрение комплексной системы обеспечения непрерывности бизнеса. Выступивший на семинаре Пол Хони, который во время терактов 11 сентября был старшим вице-президентом финансовой корпорации Merrill Lynch, отвечавшим за глобальное планирование в нештатных ситуациях и программу обеспечения непрерывности бизнеса, подчеркнул, что после этих трагических событий ему приходилось даже сдерживать энтузиазм своего руководства во вверенной ему области.
Есть ли план
Обеспечение бесперебойности бизнеса не следует рассматривать как проект, который имеет некоторые временные рамки выполнения, считает Хони. Напротив, это непрерывный процесс, требующий формирования определенной корпоративной культуры, способной поддерживать его развитие.
ИТ-инфраструктура, безусловно, играет огромную роль в поддержке бизнеса современных предприятий. Однако, подчеркивает Оганов, программа обеспечения непрерывности их работы не сводится только к достижению высокой готовности технических средств, поскольку является одним из элементов стратегического управления, интегрированным в бизнес-процессы компании.
Методология обеспечения бесперебойного бизнеса будет успешной, по мнению Хони, только при поддержке всего процесса со стороны высшего руководства компании, без которой даже максимальные усилия ИТ-департамента не принесут желаемых результатов.
Такая методология предусматривает наличие программы работы предприятия в экстремальных условиях, содержит анализ рисков и связанных с ними последствий, перечень мероприятий по устранению внештатных ситуаций и восстановлению работоспособности. Важнейший ее элемент — реализация проектов, обеспечивающих выполнение намеченных планов, связанных и с оптимизацией ИТ-инфраструктуры, и с организационными мероприятиями. Необходимо предусмотреть осуществление постоянного поддержания «боевой готовности», проведения тестирований и учебных тревог, позволяющих на практике выявить допущенные просчеты и подготовить персонал к решению реальных проблем.
Формирование программы и координация выполнения всего комплекса мероприятий должна осуществляться выделенной группой специалистов, не входящей в ИТ-подразделения и находящейся в подчинении руководства предприятия. В Merrill Lynch (численность компании во всех странах мира составляет почти 70 тыс. человек) такая группа насчитывала во время событий 11 сентября около 60 специалистов с основной командой, состоящей из 13 человек.
Брайан О’Гилви, руководитель направления HP по решениям в области бесперебойности и доступности бизнеса в регионе ЕМЕА, считает, что при составлении соответствующих программ необходимо сфокусироваться на реальных задачах, которые учитывают максимальное количество аспектов, отвечающих потребностям конкретной компании.
Аудит ряда таких программ свидетельствует о наличии определенных просчетов, допущенных при их разработке. К примеру, лишь менее 40% организаций предусматривают детальные процедуры восстановления деятельности своих главных офисов с использованием имеющихся у них резервных средств. В каждом третьем плане не учитываются необходимые последовательности действий для возобновления функционирования основных бизнес-функций; только один из четырех предусматривает различные виды подготовки персонала к работе в чрезвычайных обстоятельствах.
Все это лишь подтверждает тот факт, что значительная часть операционных рисков связана с нарушением внутренних процессов компаний, с проблемами инфраструктурных решений, а также с тем, что принято называть человеческим фактором.
Именно потребности бизнеса определяют степень важности бизнес-приложений, процессов и данных, в наибольшей степени влияющих на деловую активность и прибыльность. Это позволяет разбить их на группы в соответствии с необходимостью поддержания определенного уровня готовности каждой из них.
Для достижения данных целей служит концепция управления ИТ-услугами (IT Service Management, ITSM), содержащая более десятка процессов управления ИТ; одним из них является процесс управления непрерывностью ИТ-услуг. Сотрудники HP, где создано семейство поддерживающих ITSM продуктов и разработана модель их внедрения, по словам О’Гилви, осуществили развертывание антикризисных мероприятий в ряде известных компаний.
Качественное восстановление в приемлемые сроки средств ИТ и коммуникаций относится к важнейшим аспектам стабильности работы предприятий. Поэтому их руководство и бизнес-подразделения должны быть осведомлены о положении дел и в случае необходимости вовлечены в решение соответствующих вопросов.
Не только ИТ
ИТ-департаменты компаний самостоятельно или с привлечением консультантов способны при наличии финансовых средств решать основные вопросы стабильности работы инфраструктуры, от которой зависит не только успешность бизнеса компании, но и в ряде случаев само ее существование.
Однако и здесь необходимо предусмотреть возможное влияние внешних организационных факторов. Среди них — способность сервисных служб поставщиков используемого оборудования предоставлять дополнительные услуги и участвовать в процедурах восстановления, наличие в самих этих организациях планов по обеспечению непрерывности бизнеса, готовность аутсорсеров выполнять соглашения об уровне обслуживания (Service Level Agreement, SLA) в чрезвычайных обстоятельствах.
Как неоднократно отмечал Хони, существует также масса дополнительных аспектов, которые следует учитывать для обеспечения успешной работы предприятия в кризисных условиях. Так, при прогнозе сильнейшего снегопада в Нью-Йорке, грозившего парализовать автомобильное движение, пришлось экстренно зарезервировать более сотни номеров в близлежащих гостиницах, чтобы разместить там часть сотрудников Merrill Lynch.
Важно заранее установить связи с работниками служб экстренного реагирования, чтобы в условиях возможной неразберихи организовать оперативное взаимодействие с ними.
«Нужно понимать также, что вы будете делать, если водой залиты все ваши бумажные документы, и кто и за что отвечает в подобных ситуациях», — подчеркнул Хони.
Работу в таких условиях значительно упрощают подробные инструкции для персонала.
«Если позаботиться о выпуске содержащих такие инструкции компакт-дисков, то это поможет решить многие вопросы», — сказал Хони (в Merrill Lynch число последних измерялось десятками тысяч).
Проведение тестирований и тренировок, которые касаются не только ИТ-систем, помогает понять психологические особенности поведения людей в чрезвычайных ситуациях, правильно распределить их обязанности в экстраординарных условиях работы и определить, кто из сотрудников должен отвечать за принятие решений. Тестирование повышает вероятность правильного использования разработанных методов и планов.
По словам Хони, примерно за полгода до событий 11 сентября в здании штаб-квартиры Merrill Lynch была проведена учебная тревога с выводом всех сотрудников с их рабочих мест.
Однако не всегда возможно предвидеть масштаб событий. К примеру, 11 сентября, несмотря на успешную эвакуацию 9 тыс. сотрудников Merrill Lynch из зданий, расположенных в непосредственной близости от Всемирного торгового центра (это само по себе было весьма сложным делом), возникли проблемы их дальнейшего размещения и питания — в том числе и в помещениях, предусмотренных для работы в чрезвычайных ситуациях.
В условиях повреждения почти 300 тыс. линий голосовой связи и передачи данных весьма остро стал вопрос коммуникаций. Оказались недоступными все средства связи, способные обеспечить взаимодействие сотрудников, за исключением Internet.
«Был организован кризисный Web-сайт — единая точка коммуникаций, обеспечившая информирование и взаимодействие персонала в США и в других регионах мира», — пояснил Хони.
Что же касается непосредственно ИТ, то одной из наиболее трудоемких процедур оказалась обработка 20 тыс. резервных магнитных лент. В связи с этим Хони рекомендовал обращать внимание на оптимизацию не только резервного копирования, но и последующего восстановления, а если есть возможность, переходить на дисковые системы хранения».
Координация усилий
«Во время семинара возник вопрос о возможности выбора рамочной рекомендации, на базе которой можно создать собственную систему поддержки бесперебойного бизнеса, — отметил О’Гилви. — Такое возможно, но очень непросто. Полезно привлекать консультантов».
Реализация подобных проектов требует совместной работы исполнителей и заказчиков. Поскольку заказчики осведомлены обо всех нюансах своего бизнеса, принято анкетировать менеджеров с последующей обработкой полученных результатов, разработкой планов и реализацией дальнейших мероприятий поддержания непрерывности бизнеса.
«Это весьма трудоемкий и длительный процесс, зависящий и от учета рисков, и от количества бизнес-процессов, которые требуют защиты. Отработка только одного сценария возможного развития событий в организации, насчитывающей около тысячи сотрудников, требует просмотра от 600 до тысячи «шагов», — подчеркнул Оганов.
Проекты, которые в настоящее время реализуют в «Ай-Теко» в данной области, связаны главным образом с ИТ-инфраструктурой. В компании полагают, что в условиях роста конкуренции в отечественном бизнесе число таких проектов будет расти, а также будет расширяться их качественное наполнение.