В ЭТОМ ЦЕНТРЕ управляют работой ЦОД DataLine |
В компании DataLine с октября приступают к предоставлению катастрофоустойчивого облачного сервиса CloudLine Metrocluster. «Работу над созданием катастрофоустойчивых вычислительных комплексов мы начали после того, как к нашему центру обработки данных на Боровой в 2010 году добавился ЦОД на Коровинском шоссе», — отметил Сергей Мищук, технический директор DataLine.
В компании первоначально использовалась программная система Double-Take Software, которая позволяет осуществлять асинхронную репликацию файлов физических и виртуальных серверов приложений, автоматизирует процедуры определения нештатных ситуаций и восстановления, способна работать со «слабыми» каналами передачи данных. Как утверждают в DataLine, ее высокая цена существенным образом влияла на стоимость соответствующих услуг для конечных заказчиков и, как следствие, являлась главным фактором низкого спроса.
Поэтому для сервиса CloudLine Metrocluster были использованы продукты NetApp, программное обеспечение VMware vSphere, vCenter Site Recovery Manager и ряд других решений VMware. Сервис основан на дублировании систем хранения данных в двух территориально разнесенных площадках ЦОД.
Длина канала связи между местами размещения центров обработки данных DataLine — 33 км. «ЦОД соединяют наши собственные кабели. В них вполне достаточно оптических волокон, чтобы резервировать и четырехгигабитные каналы Fibre Channel, и коммуникации 10Gigabit Ethernet», — подчеркнул Мищук.
В DataLine утверждают, что благодаря синхронной репликации данных работа приложений в облаке будет продолжаться даже при отказе одного из узлов метрокластера. Однако, по словам Эдуарда Бавижева, руководителя отдела виртуализации, следует придерживаться определенных правил — к ним, например, относится требование отсутствия так называемых растянутых машин, при формировании которых виртуальные серверы и их данные размещаются на различных площадках. Дополнительным преимуществом CloudLine Metrocluster специалисты компании считают возможность балансировки нагрузки на уровне сети ЦОД.
Бавижев пояснил, что при отказе физической машины восстановление работоспособности размещенного на ней виртуального сервера, который перемещается на один из соседних или удаленных хостов, занимает не менее двух минут (это время определяется возможностями операционной системы). Процесс полного перехода на другой ЦОД, который осуществляется администратором и позволяет избежать рассогласованности данных, потребует не менее 15 минут.
В каждом ЦОД предусмотрен 30-процентный резерв вычислительных ресурсов по отношению к их пиковой загрузке.
Первыми пользователями сервиса CloudLine Metrocluster, применявшими его для создания частных облаков, стали несколько розничных сетей.