S&T знакомит с опытом создания резервных центров управления бизнесом
События 11 сентября прошлого года заставили по-иному взглянуть на проблему надежности хранения данных и создания резервных центров управления бизнесом |
События 11 сентября прошлого года заставили по-иному взглянуть на проблему надежности хранения данных и создания резервных центров управления бизнесом. Это объясняет внимание, которое привлек семинар по продуктам компании Legato, проведенный системным интегратором S&T.
Компания Legato продвигает две группы решений: средства защиты данных и технологии повышения готовности информации. В первую группу входит продукт Legato NetWorker, а также семейство инструментов управление устройствами и носителями данных AlphaStor и Celestra, система высокоскоростного резервного копирования. Вторую группу образуют продукты обеспечения высокой готовности данных Legato Application Availability Manager и системы для защиты критически важных данных и приложений в сетях Windows — RepliStor и Co-StandbyServer.
Legato NetWorker сразу после своего дебюта был хорошо принят и в мире Unix, и в мире Windows; более того, NT File System Backup базируется именно на основе NetWorker.
Особый интерес у слушателей вызвало выступление Константина Сальникова, системного инженера Legato Systems в США, принимавшего непосредственное участие в ликвидации последствий нью-йоркской катастрофы. Были рассмотрены весьма поучительные примеры действий трех клиентов Legato, которые выбрали разные стратегии восстановления данных. Объединяло клиентов то, что у них имелся резервный центр на другом берегу Гудзона, примерно в двух километрах от места трагедии.
Клиент 1 — крупная финансовая компания, потерявшая под обломками Всемирного торгового центра 70% своего персонала. У нее отсутствовал четкий план восстановления деятельности после катастроф, резервная информация была месячной давности. Мало того, в компании имелись две группы администраторов систем на платформах Unix и Windows, которые, как это обычно бывает, особо друг с другом не ладили и работали по удобному лишь для себя графику: первые в свободном режиме с поздними выходами на работу и ночными бдениями, а вторые — с четким соблюдением графика, принятого для основного персонала. За двое суток работы в две-три смены оставшиеся в строю сотрудники развернули резервный центр и восстановили все, что можно было, одновременно создав новую систему резервного копирования.
Клиент 2 — также крупная финансовая компания, отсутствие которой на торгах в ближайший после аварии понедельник означало бы ее выход из бизнеса по причине потери 1200 клиентов, банкротство и безработицу для десятков тысяч сотрудников. Компания размещалась поблизости от Всемирного торгового центра, и ее здание также пострадало. Эта компания, как и предыдущая, имела резервный центр, однако относительно актуальные данные на 20 тыс. лентах хранились непосредственно в ее главном здании. Когда с большим трудом удалось переправить эту массу лент на другой берег реки, оказалось, что нет метаданных — указателей, позволяющих восстановить в резервном центре утерянную конфигурацию. Такие метаданные нашлись в лондонском отделении компании, однако и здесь не существовало четко прописанной и документированной процедуры восстановления информации после катастроф. Учитывая, что в банке использовалась весьма разнообразная техника, задача восстановления была отнюдь не тривиальной. К тому же недостаточная мощность аппаратуры резервного центра не позволяла в полной мере поднять всю инфраструктуру основного. Однако за пять дней удалось восстановить то, что накапливалось в компании в течение 50 лет.
Клиент 3 — крупнейший в США банк, имевший две площадки: основную и резервную, на которых были развернуты зеркальные конфигурации Unix- и Windows-систем. В отличие от предыдущих клиентов, в этом банке была четкая документация по восстановлению, позволившая даже неспециалистам по шагам воссоздать конфигурацию. Однако и здесь не обошлось без сюрпризов. Если для Unix-платформ все данные еще до катастрофы оказались в резервном центре и администраторам оставалось только проследить, чтобы «поднялись» все серверы, то данные для Windows-систем хранились на 100 лентах и опять же — в главном здании. Причем в момент теракта некоторые ленты находились в устройствах и их в суете забыли вынуть. Тем не менее за неделю с помощью специалистов Legato удалось восстановить почти всю информацию.
Сальников сформулировал некоторые поучительные выводы: следует избегать систем с единой точкой отказа; нужно распределять сети; избегать зданий высокой этажности и их концентрации на одной площади; необходимо вести документацию по восстановлению аппаратуры и данных, резервируя ее так же, как и сами данные; тестировать резервную конфигурацию и следить за ее соответствием основной; необходимо иметь четкую схему приоритетов восстановления, а также позаботиться о «горячем» и «теплом» резерве.