Нередко поддержка непрерывности бизнеса оказывается востребованной в процессе совершенствования корпоративного управления, например при подготовке к IPO или слиянию с другой компанией.
Зачастую топ-менеджеры предприятий дают добро на реализацию лишь технологических аспектов непрерывности, поручая ИТ-подразделениям планирование и организацию мер по ее обеспечению. Компании нередко не понимают степень важности информационных технологий для бизнес-процессов, в них отсутствуют планы развития информационной поддержки бизнес-процессов хотя бы в среднесрочной перспективе (1–3 года). Из-за этого возникают многочисленные просчеты в планировании и неэффективно расходуются средства, выделенные на обеспечение непрерывности.
Возникают вопросы
Даже при том условии, что ИТ-отдел способен оценить текущие и перспективные потребности в информационных ресурсах, а следовательно, и объем необходимой поддерживающей инфраструктуры (такой как центр обработки данных), возникают следующие вопросы.
Ограничивается ли задача поддержки непрерывности бизнеса бесперебойным функционированием ИТ-систем?
Все ли информационные ресурсы должны быть вовлечены в поддержку непрерывности бизнеса?
Какую степень отказоустойчивости должны иметь ИТ-ресурсы и поддерживающая их инженерная инфраструктура?
Кто и как должен обеспечивать правильную эксплуатацию информационной среды, которая включает в себя не только системы хранения и обработки данных, локальные и глобальные коммуникационные системы, но и инфраструктуру серверных комнат и ЦОДов?
Мировой опыт показывает: для устойчивого развития компании и поддержания ее эффективной операционной деятельности необходимо тщательно планировать потребности в ИТ. Такое планирование возможно лишь в том случае, если организован точный учет использования ИТ-ресурсов и вспомогательных инженерных систем. Планирование информационных потребностей должно базироваться на долгосрочной стратегии развития бизнеса.
Ее неотъемлемая часть — внедрение процесса обеспечения непрерывности бизнеса на общекорпоративном уровне с привлечением максимального количества структурных подразделений. В свою очередь, процесс обеспечения непрерывности должен соотноситься со стратегией развития ИТ и стратегией обеспечения информационной безопасности. Только на стыке трех указанных стратегий можно формировать четкие корпоративные требования к ИТ-ресурсам (производительности, отказоустойчивости, непрерывности и масштабируемости) и к поддерживающей их инфраструктуре.
Правильный подход
Системный подход к достижению непрерывности, базирующийся на общепризнанных мировых практиках, включает в себя анализ уязвимости всех деловых процессов компании и оценку зависимости бизнеса от этих процессов. После подготовки списка критичных бизнес-процессов и определения параметров их непрерывности выявляют качественные и количественные параметры ресурсов (в том числе информационных), поддерживающих эти бизнес-процессы. Перечислим основные параметры:
-
точка восстановления бизнес-процесса. Она указывает, какой предыдущий критический шаг бизнес-процесса должен быть восстановлен для сохранения его целостности (Recovery point objective, RPO);
-
критическое время восстановления процесса. Речь идет о максимальном времени восстановления ресурсов (простоя), поддерживающих критический бизнес-процесс (Recovery time objective, RTO);
-
объем восстановления процесса (Recovery volume objective, RVO).
Все это следует учитывать в каталоге информационных ресурсов компании и соответствующим образом отображать в корпоративных соглашениях об уровне предоставления услуг (ресурсов).
Если же говорить о технологической составляющей процесса обеспечения непрерывности бизнеса, то одной из наиболее затратных и сложных частей является создание и эксплуатация ЦОДа.
Размер не имеет значения
Дата-центры бывают разными. Это может быть маленькая серверная комната, оснащенная бытовой системой кондиционирования, простейшим источником бесперебойного питания и углекислотным огнетушителем, в которой расположена одна телекоммуникационная стойка. Есть и ЦОДы, соответствующие международным стандартам, таким как TIA-942. Они оснащены газовыми средствами пожаротушения, резервированными системами кондиционирования, бесперебойным электроснабжением и обеспечивают круглосуточное функционирование сотен стоек с вычислительным и телекоммуникационным оборудованием. Но вне зависимости от масштаба ЦОДа все его системы должны быть спроектированы на основе требований бизнеса и соответствовать указанным характеристикам непрерывности предоставления ресурсов.
Например, нет необходимости в создании высоконадежной, многократно резервированной системы электроснабжения и кондиционирования, если в серверной комнате расположен один сервер, а основным критическим информационным ресурсом компании является выполнение трех бухгалтерских проводок в день. В таком случае достаточно оснастить серверную приточно-вытяжной вентиляцией и одним простейшим источником бесперебойного питания.
Гораздо сложнее обеспечить непрерывность в крупных организациях, бизнес-процессы которых целиком автоматизированы. Тогда малейший простой может обернуться значительными убытками, потерей репутации или взысканиями со стороны регулирующих органов. Тут особенно важны наличие стратегии развития компании и планов развития информационного окружения, активное всестороннее взаимодействие главы фирмы с руководителями основных и поддерживающих бизнес-подразделений, своевременный учет изменений бизнес-среды и регуляционных требований.
После выявления параметров непрерывности и объемов предоставления обеспечивающих ресурсов следует определить необходимые информационную и инфраструктурную составляющие. Решения, которые могут стать основой этих составляющих, обязательно должны быть проанализированы на предмет эффективности вложения средств.
На принятие решения может повлиять устойчивая тенденция перехода к централизованной схеме предоставления информационных ресурсов, в рамках которой основные средства обработки, хранения и передачи данных сосредоточены в одном или нескольких (основном и резервных) центрах обработки данных и образуют единое защищенное ядро корпоративной сети. При этом доставка информационных ресурсов до рабочего места сотрудника компании, в независимости от его географического местонахождения, осуществляется при помощи терминальных решений или Web-технологий. При планировании строительства нового или модернизации старого ЦОДа следует учесть возможность концентрации всех вычислительных ресурсов компании на одной площадке.
При разработке решений для организации информационного окружения в целом и обеспечения непрерывности в частности учитывают, при необходимости, локальные и международные регуляционные требования к информационному окружению финансово-экономической деятельности компании (требования закона Sarbanes–Oxley, IFRS, GAAP и др.). Следует принять во внимание необходимость разграничения физического и удаленного доступа к ИТ-ресурсам, наличие развитых средств резервного копирования и защиты информации, помнить об обязательном отделении сред разработки и тестирования от основной информационной среды. Эти условия могут повлиять на количество устанавливаемых средств обработки и хранения информации, телекоммуникационного оборудования и, в конечном счете, на стоимость инфраструктурных решений.
Вместе и порознь
Решения для обеспечения непрерывности могут иметь локальный характер, т.е. заключаться в построении гарантированно восстанавливаемой среды на уровне отдельного критического приложения. Непрерывность может быть реализована и путем построения распределенных отказоустойчивых систем, включающих в себя основной ЦОД и один или несколько резервных вычислительных центров.
Если принимается решение о построении распределенного информационного окружения, следует обратить внимание на разные типы организации резервных центров обработки данных.
«холодный» резервный ЦОД — это подготовленное для размещения оборудования помещение, оснащенное всей необходимой инфраструктурой (бесперебойное питание, система кондиционирования и пожаротушения, точки подключения к телекоммуникационным провайдерам, стойки для размещения оборудования). В «холодном» ЦОДе для возобновления предоставления информационных ресурсов необходимо доставить, развернуть и сконфигурировать оборудование, полностью восстановить данные с резервных копий, настроить сетевое окружение для соединения с корпоративной сетью передачи данных. Такой вариант характеризуется незначительной стоимостью владения, наибольшими временем (до 2 недель) и сложностью восстановления доступа к ИТ-ресурсам.
«Горячий» резервный ЦОД оснащен необходимой инфраструктурой. Его вычислительное оборудование и системы хранения установлены и сконфигурированы, сетевое окружение настроено, основные данные загружены и регулярно обновляются в рамках расширенных процедур резервного копирования. Такое решение обеспечивает восстановление предоставления информационных ресурсов за 4–12 ч (в зависимости от сложности информационного окружения и сетевой топологии).
Наконец, «зеркальный» резервный ЦОД. Речь идет о полностью работоспособном удаленном информационном окружении, содержащем «зеркальную» копию критически важных информационных ресурсов. Синхронизация данных с основным центром обработки данных осуществляется в режиме реального времени. Сетевое окружение полностью сконфигурировано. Комплекс программно-аппаратных средств и организационных мероприятий позволяет возобновить предоставление информационных ресурсов прозрачно для пользователей в кратчайшее время (порядка 5–10 с).
Кроме того
Планирование, строительство и ввод в эксплуатацию даже самого современного ЦОДа не тождественны обеспечению непрерывности бизнеса. Процесс эксплуатации ЦОДа должны поддерживать квалифицированный персонал, соответствующие политики и процедуры, строгое соблюдение регламента обслуживания всех систем жизнеобеспечения. Этот процесс включает в себя своевременное обучение персонала, его регулярную аттестацию и внутренний аудит соблюдения регламентных процедур. Необходима регулярная отработка сценариев аварийного восстановления как в отделах информационных технологий и эксплуатации, так и в рамках всей компании. Результаты учений и проверок нужно анализировать и своевременно учитывать в организационной составляющей процесса управления непрерывностью.
Илья Басин (i.basin@isgr.ru) — начальник отдела по работе с ОЭЗ, управление инфраструктуры ISG, Сергей Шуршалин (s.shurshalin@isgr.ru) — заместитель генерального директора по интеграции и инфраструктуре ISG