Пользуясь услугами по восстановлению данных и обеспечению непрерывности работы важных ИТ-систем, предусмотрительный клиент может продолжить работу даже в случае физического уничтожения офиса.
В современном мире поддержание непрерывности работы бизнеса часто эквивалентно его существованию. Это обстоятельство порождает рынок весьма специфических и недешевых услуг по восстановлению данных и непрерывности работы важных ИТ-систем (Disaster Recovery Services), пользуясь которыми предусмотрительный клиент может продолжить работу даже в случае физического уничтожения его офиса.
После событий 11 сентября доказывать необходимость резервирования бизнес-процессов никому не нужно. Конечно, причины остановки бизнеса могут быть и менее зловещими — природные и техногенные катастрофы, влияние «человеческого фактора» или банальные сбои аппаратно-программного обеспечения. Обычная в таких случаях на Западе (и уже разрабатываемая крупными страховыми компаниями в России) страховая премия может и не помочь, поскольку пребывание бизнес-структуры в недееспособном состоянии нередко ведет к ее исчезновению с рынка. Обеспокоенность крупных организаций своим будущим породила особый бизнес, который называется Disaster Recovery Services (DRS) — услуги по восстановлению критически важных бизнес-процессов клиента в случае катастрофы. Основной составляющей этих услуг является создание Disaster Recovery Center (DRC) — специального центра, оснащенного самыми современными средствами обеспечения физической и информационной безопасности, сетевой и аппаратной инфраструктурой, линиями связи и т. д. Стоимость такого центра может измеряться миллионами, а то и десятками миллионов долларов.
Однако созданием дорогостоящих центров DRC дело не ограничивается. Требование обеспечения непрерывности бизнес-процессов придало новому сегменту черты рынка консалтинговых услуг. Относительно недавно даже появился термин Disaster Recovery Planning and Management (DRPM) — планирование и менеджмент восстановления бизнес-процессов после катастроф.
Индустрия DRS стала формироваться в начале 80-х. Сначала клиентам оказывались услуги по резервному копированию информации. Затем их спектр расширился, и сейчас клиентам предлагаются не только вычислительные мощности и офисные помещения, но и консалтинг по улучшению текущей бизнес-деятельности с целью уменьшения потенциального риска.
Крупнейшими компаниями, специализирующимися на рынке услуг DRS, являются:
- HP Invent Business Recovery Services - подразделение, входящее в структуру служб HP Services и оказывающее услуги восстановления непрерывности бизнеса и ИТ-операций крупным компаниям.
- IBM Business Continuity and Recovery Services - подразделение, входящее в IBM Global Services, специализирующееся на анализе рисков, внедрении специальных приложений и оказании услуг поддержания критических бизнес-процессов.
- SunGard Recovery Services - независимая компания, предоставляющая 5,5 тыс. клиентов около 300 тыс. квадратных метров своих центров данных (data center), расположенных по всей Северной Америке, и предлагающая на них услуги DRS.
- Cable&Wireless (включая недавно поглощенную компанию Exodus, владеющую сетью центров данных) - глобальная телекоммуникационная группа, оказывающая в том числе услуги аренды своей инфраструктуры и DRS. Cable&Wireless имеет в России собственные центры данных, расположенные в Москве.
Ряд других западных компаний, которые специализируются на Web-хостинге и сдаче в аренду приложений (Application Service Providing — ASP), например, USinternetworking, NaviSite, eDeltaCom, также оказывают отдельные услуги DRS.
IBM, HP, SunGard, которые работают в данной области от 10 до 20 лет и обслужили за это время порядка 300-400 реальных случаев восстановления бизнеса, из которых несколько десятков приходится на 11 сентября 2001 года. Численность персонала соответствующих подразделений — более 1000 человек у каждой компании. Количество центров данных — по 20-40, географически распределенных, связанных собственными сетями передачи данных. HP и SunGard предлагают также специализированные автономные мобильные центры «на колесах» (трейлеры).
Впервые в массовом, практически общепланетарном масштабе необходимость DRPM стала всем очевидной перед наступлением 2000 года. Американское правительство разработало тогда перечень требований Continuity of Operations Planing (COOP), коим каждое ведомство должно было соответствовать. В области финансов в США существует ряд актов (например, Gramm-Leach-Bliley Act, Expedited Funds Availability Act), предписывающих банкам соответствовать требованиям непрерывности их деятельности. В Великобритании для тех же целей принят Financial Services Act. Непрерывность работы здравоохранительных учреждений США регламентирует Health Insurance Portability and Accountability Act. Бесперебойность деятельности телекоммуникационных систем контролирует всесильная Федеральная комиссия по связи США. Непрерывность работы бизнес-систем регламентируется также и различными международными стандартами, такими как ISO/IEC 17799:2000, ISO 9002.
К сожалению, мировой статистики, описывающей реальную картину потерь от вынужденного простоя, нет. Компании обычно стремятся скрыть серьезные сбои в работе своих информационных систем и тем более не афишируют потерю важной информации. В России о такой статистике говорить и вовсе не приходится. Однако понимание актуальности такой услуги, как DRS, растет. Уже сейчас в Москве функционирует DRC DATA FORT — совместный проект компании IBS и транснациональной телекоммуникационной группы Cable&Wireless.
Как правило, услуги DRPM подразделяют на три класса, отличающихся по сложности и, соответственно, стоимости. Формально их можно назвать: резервирование данных клиента, резервирование информационной системы клиента и, наконец, физический перенос жизнедеятельности клиента в резервный офис.
Под резервированием данных понимается доставка в центр, хранение и восстановление на территории DRC корпоративных данных клиента. Причем DRC берет на себя обязанность постоянно обновлять эти данные (так называемая актуализация) и незамедлительно предоставлять доступ к ним в момент наступления аварийного события. Стоит отметить, что здесь под корпоративными данными подразумеваются данные, существующие в электронном, но не в бумажном виде.
Резервирование информационной системы означает фактическое создание и поддержание в работоспособном состоянии на территории DRC программно-технического комплекса информационной системы клиента в соответствии с его специфическими требованиями к аппаратным средствам и критически важным бизнес-приложениям. В реальности, конечно, резервируется некоторое «ядро» информационной системы, настроенное в соответствии с заранее оговоренной конфигурацией. Для этого определяются критически важные приложения — программы, без которых невозможна основная деятельность организации, — и оговариваются условия функционирования этих программ.
Самым предусмотрительным предназначается комплексная услуга, практически вбирающая в себя две предыдущих, — резервный офис. Она может содержать в себе множество мероприятий, далеко выходящих за рамки поддержания информационной структуры предприятия. При желании и, естественно, наличии средств клиент может заказать охраняемое офисное помещение, оборудованное необходимой техникой, подключенное к внешнему миру с помощью выделенных каналов связи.
Идея резервного офиса не нова. Так, во время Великой отечественной войны в Куйбышеве был создан дубликат ставки Верховного главнокомандующего. Несмотря на то, что Сталин не воспользовался этим резервным офисом, услуга, относящаяся к категории Disaster Recovery Planning and Management, была заказана и осуществлена.
DRS является составляющей более комплексной услуги — Business Recovery Services (BRS), которая чаще всего предлагается крупным заказчикам, имеющим разработанный план восстановления бизнеса и выбирающим его исполнителя.
Суть BRS состоит в составлении раздела бизнес-плана, посвященного выживаемости бизнеса в случае природных или техногенных катастроф и подобных им ситуаций, и в предложении реальных мер по обеспечению готовности к ним. Поскольку роль ИТ-услуг в бизнесе весьма высока, технологически услуга не менее чем на 50% состоит из них, а оставшуюся часть составляют транспорт, управление офисом и сопряженные мероприятия, такие как переключение телефонной номерной емкости, изменение логистики работы с клиентами и т. д.
Решение задачи BRS распадается на несколько этапов (см. табл.) и подразумевает участие консультанта и системного интегратора. Предложение DRS начинается с технологической составляющей, касающейся обработки, хранения и передачи данных, а также рабочих мест, необходимых для этого. Другими словами, оно касается обеспечения непрерывности ИТ-процессов, и лишь при выдвижении более высоких требований — непрерывности бизнеса.
DRS — естественный этап как в развитии рынка ИТ-услуг, так и в готовности различных компаний оценить важную роль информационных технологий в своих бизнес-процессах. В нашей стране многие организации уже пришли к осознанию зависимости успеха и надежности бизнеса от ИТ.
Дмитрий Поляков — технический директор проекта DATA FORT, компания IBS. Ему можно написать по электронной почте по адресу dpoliakov@ibs.ru
ОСНОВНЫЕ ПОНЯТИЯ
MCA — Mission Critical Application — критически важное приложение, без работы которого невозможна основная деятельность организации по обслуживанию клиентов или процессов.
BRS — Business Recovery Services — услуги восстановления бизнес-процессов, обеспечение непрерывности основной деятельности заказчика, верхний уровень интеграции консалтинговых и технологических услуг.
DRS — Disaster Recovery Services — услуги восстановления при чрезвычайных ситуациях работы критических систем и процессов, относящихся к компетенции ИТ-отделов (критически важные приложения, электронная почта, телефонная связь и др.) и офис-менеджеров (копиры, курьеры, логистика офиса); технологический уровень услуг.
DRC — Disaster Recovery Center — резервный центр операций на случай чрезвычайных событий — площадка и средства для оказания технологических услуг DRS, имеет стационарную или мобильную реализацию и может включать в себя резервный офис (recovery office).
Disaster — катастрофа — ситуация, когда необходимо переключение бизнес-процессов заказчика на ресурсы исполнителя, определяется либо договорным перечнем форс-мажорных ситуаций, либо безусловным желанием заказчика без объяснения причин (disaster declaration).
RTO — Recovery Time Objective — целевое время восстановления, необходимое для начала работы в режиме переключения с момента заявления заказчика о катастрофе. Это время, с одной стороны, определяется бизнес-планами заказчика, а с другой — подтверждается техническими средствами и услугами исполнителя. RTO определяет фактический уровень услуг BRS/DRS.
ПРОФИЛЬ ЗАКАЗЧИКА УСЛУГ DRS
Ниже приводятся результаты обработки статистики из опроса журнала Network Computing, опубликованного в марте 2001 года, которые позволяют оценить требования к системе и услугам DRS.
Рис. RTO в запросах клиентов |
Время восстановления (RTO)
Предпочитаемые заказчиком параметры RTO в основном относятся к диапазону 4-24 часа, что дает 65% запросов (см. рис.).
Следует отметить, что данный уровень услуг практически недостижим на основе схем «холодного» развертывания систем под заказчика. Он подразумевает «горячее» резервирование и, как минимум, ежесуточную синхронизацию данных с основной системой.
Объем данных заказчика
Статистика об объеме данных в системах заказчика такова. У 50% опрошенных объем данных не превышает 1 Tбайт, объем данных 40% респондентов составляет от 1 до 20 Tбайт, и только 10% используют более 20 Tбайт. Таким образом половина респондентов довольствуется 1 Тбайт объема хранилищ данных, а требования 90% опрошенных не выходят за рамки 20 Тбайт. Планы роста объема данных есть у всех, и составляют от 5 до 25% в год.
В то же время респонденты по-разному оценивают объем критических подлежащих восстановлению данных. 34% опрошенных считают, что их объем не превышает 5% от общей хранимой информации. Оценки 40% респондентов колеблются от 5 до 50%. Остальные считают, что восстановлению подлежат более 50% всех данных. Таким образом почти три четверти опрошенных потребуют от DRC не более половины хранимого объема своих данных, что составит от 500 Мбайт до 10 Тбайт.
Подход к постановке задачи BRS/DRS
Согласно опросу, стратегия обеспечения непрерывности формитруется из различных соображений. 26% опрошенных формирует ее для обеспечения непрерывности бизнес-процессов всей компании, 31% — для поддержки работоспособности бизнес-подразделения, 37% — для обеспечения работоспособности бизнес-приложений.
Это означает, что 57% респондентов подразумевают наличие бизнес-плана восстановления на момент наступления катастрофы, а 37% полагают, что работающее основное приложение автоматически означает непрерывность бизнеса. Очевидно, что это более справедливо для относительно мелких заказчиков услуг DRS.