С усложнением центров обработки данных возрастает потребность в едином инструментарии для управления всеми системами ЦОД. По прогнозам компании 451 Group, уже через два-три года такие решения будут использоваться в большинстве ЦОД, а к 2020 году оборот рынка DCIM превысит 7,5 млрд долларов. Подобные заявления привлекают на данный рынок компании с разным бэкграундом — поставщиков СКС, разработчиков ИТ-решений, производителей инженерных систем и многих других. Чтобы создать успешный продукт, им предстоит решить непростую задачу — совместить два несхожих мира: инженерные и ИТ-системы. Используемые подходы, как и поддерживаемый функционал, зачастую сильно отличаются. Raritan, известный поставщик переключателей KVM, ставит во главу угла систему инвентаризации. IDC относит эту компанию к «заметным» игрокам на рынке DCIM, отмечая, что по уровню предлагаемых решений она находится рядом с лидерами CA и Schneider Electric. О возможностях выпускаемого ею пакета DCIM рассказывает Свен Андерсон, главный технический специалист Raritan.
Журнал сетевых решений/LAN: Какие причины побудили Raritan сфокусироваться на DCIM?
Свен Андерсон: Едва ли не с момента образования компании — а она существует уже больше 20 лет — мы предлагали решения для центров обработки данных. До 2005 года поставлялись преимущественно переключатели KVM. В этот момент руководство компании задумалось, каким будет рынок через несколько лет и какие решения будут пользоваться спросом. Уже тогда было ясно, что одним из ключевых вопросов будет управление энергией в ЦОД.
Обычные электросчетчики предоставляют лишь общую информацию о том, сколько энергии потребляет оборудование ЦОД, но, не имея данных об энергопотреблении конкретных сервисов, невозможно понять, на что конкретно расходуется энергия.
В начале 2006 года Raritan представила первый блок распределения питания (Power Distribution Unit, PDU) с измерением потребления на уровне розеток. В то время мы были единственной компанией, у кого был подобный продукт. С тех пор наш портфель решений для управления энергией значительно расширился, в особенности для ЦОД. Принятая нами модель, предполагающая предоставление заказчикам кастомизированных PDU, оказалась успешной — кроме нас таких систем пока никто не производит.
Мы всегда внимательно прислушивались к пожеланиям заказчиков. С укрупнением центров обработки данных у них все явственнее стала формироваться потребность в едином инструменте для управления ЦОД. Раньше для этого использовались стандартные средства, в частности, таблицы Excel, куда вручную заносилась информация для отслеживания различных активов. Однако, когда ЦОД достигает определенных размеров (а они становятся все больше и больше вследствие тенденции к консолидации), управлять им с помощью доморощенных инструментов уже невозможно. Потенциальный спрос подтолкнул нас к разработке системы для управления инфраструктурой ЦОД — Data Center Infrastructure Management (DCIM). Это направление не было новым для компании, поскольку тема ЦОД разрабатывается нами уже много лет.
LAN: Насколько полным является предлагаемый пакет DCIM?
Андерсон: Мы выпустили более или менее полный программный пакет — мало кто может этим похвастаться (сейчас ни у одного поставщика нет полного решения). Как бы то ни было, решение имеет все компоненты, которые присутствуют в модели DCIM, составленной аналитической компанией 451 Group. Я уже упоминал о распределении и управлении энергией, но это только часть пакета. Интеллектуальные PDU вместе с соответствующим ПО могут собирать исчерпывающую информацию о потреблении энергии не только всеми серверами в ЦОД, но и любым другим оборудованием — сетевыми коммутаторами, системами охлаждения и т. п. Далее, с помощью датчиков для измерения температуры, влажности и других параметров, можно контролировать состояние окружающей среды.
Важным аспектом управления ЦОД является интеллектуальное управление активами/ресурсами. Если такое решение внедрено, то на его основе можно будет делать все остальное. Например, зная, где какие активы находятся, можно осуществлять планирование емкости — это касается не только энергетической мощности, но и физической вместимости (свободного пространства в стойках), объемов хранения, сетевых ресурсов (незанятых портов, доступных IP-адресов) и т. д.
Еще один аспект DCIM — управление изменениями. Для сохранения порядка в ЦОД необходимо ввести стандартные процедуры внесения изменений. Без этого в центре обработки данных быстро возникнет неконтролируемый хаос. Система управления изменениями позволяет выдавать наряды на работу, например на установку сервера. При этом осуществляется автоматический контроль за временем установки сервера, его энергопотреблением, за идущими к нему соединениями и прочими показателями.
Но опять же без управления активами это бессмысленно, поскольку все действия придется выполнять вручную.
Только зная, где какое устройство находится, можно реализовать остальной функционал DCIM.
LAN: Как реализуется управление активами?
Андерсон: У одного нашего американского клиента, крупной ИТ-компании, специализирующейся на организации интернетаукционов, было 20 сотрудников, которые занимались только инвентаризацией активов с помощью сканеров штрихкода и тому подобных средств. Совместно с этим клиентом мы разработали оригинальное решение — сенсорную планку для управления активами (Asset Management Strip, AMS). Она устанавливается в шкафу, а к ней с помощью магнита подсоединяются идентификационные теги (asset tag). Последние представляют собой по сути полоску пластика с металлическим наконечником, внутри которого находится идентификационный чип (64-разрядный ID).
Перед установкой к новому устройству прикрепляют идентификационный тег и заносят информацию о нем в базу данных, которую мы также предоставляем (как правило, для внесения сведений достаточно считать штрихкод продукта). После этого можно отслеживать местонахождение данного актива в ЦОД — при установке оборудования в стойку тег просто подсоединяется к планке. Над каждым магнитным соединителем находятся три индикатора LED, благодаря которым техник узнает, правильно ли он выполнил операцию. Кроме того, световые сигналы помогают найти нужное устройство в ЦОД, формируя своеобразную путеводную нить. Это физическая часть нашего решения для управления активами, позволяющая отслеживать изменения (события), происходящие с оборудованием. Информация направляется в центральное программное обеспечение управления активами — взаимодействие между программной и аппаратной частью осуществляется по протоколу SNMP.
LAN: Почему вы не используете один из традиционных способов осуществления идентификации?
Андерсон: Действительно, на рынке имеются разные системы идентификации — одни базируются на RFID, другие задействуют беспроводные технологии, в третьих предлагаются только бумажные бирки со штрихкодом. Мы рассматривали все три подхода, но в итоге реализовали иное решение. Один из наших клиентов провел обширное тестирование RFID и пришел к выводу, что эта технология не подходит для ЦОД. Один из аргументов — трудность определения, на какой именно высоте в стойке находится оборудование, поскольку технология RFID не позволяет сделать это достаточно точно.
Да, на рынке появились технологии, где подобная проблема решается путем комбинации RFID и инфракрасной передачи. Однако наше решение имеет и другие преимущества. Так, сенсорные планки реализуют световую индикацию, обеспечивающую визуальную обратную связь. Кроме того, что немаловажно, сами идентификационные теги недороги и не нуждаются в обслуживании. А вот в RFID-тегах используются батарейки, и необходимость их замены через 3–5 лет способна создать огромные неудобства. У некоторых наших клиентов в ЦОД установлено более 20 000 устройств, которыми требуется управлять, и замена всех RFID-тегов обернется настоящим кошмаром.
Еще один важный момент — для наших тегов предлагаются программируемые версии чипов. Это означает, что клиент может сохранить уже используемую им схему идентификации (нумерации). Ему нет нужды использовать нашу предопределенную схему нумерации.
LAN: Какие главные задачи призвана решать система DCIM?
Андерсон: Чтобы улучшить функционирование ЦОД, необходимо оптимизировать различные аспекты повседневных операций. Одна из основных задач — экономия энергии. Причины известны — энергия дорожает, а ЦОД потребляют все больше. Другая важная задача — управлять энергопотреблением таким образом, чтобы предельно допустимые параметры не превышались в рамках как всего ЦОД, так и конкретной стойки. Наше ПО способно точно указать, где есть необходимая мощность для размещения нового сервера. Причем система позволяет удостовериться, что никаких коллизий не возникнет на всем пути подачи энергии к этой стойке.
Упоминавшаяся модель DCIM, предложенная 451 Group, предусматривает планирование емкости, моделирование, прогнозирование и анализ. Именно это является главным преимуществом применения инструментария DCIM. Наше программное обеспечение dcTrack предоставляет именно такой функционал. Уровнем ниже выполняются управление данными, интеграция и формирование отчетов, а на самом нижнем — мониторинг окружающей среды и измерение параметров. Для этого у нас имеются различные сенсоры и датчики.
Как известно, клиенты не хотят иметь дело со множеством различных инструментов, а для обеспечения их интеграции система должна быть открытой. Мы предоставляем открытые интерфейсы в базу данных dcTrack с целью обеспечения соединения с другими системами, что полностью отвечает запросам клиентов, которые предпочитают использовать накопленные базы данных и комбинировать их с имеющимися решениями.
Благодаря сбору подробной информации о потреблении энергии планировщик может моделировать различные сценарии развития ЦОД и рассчитать, например, какие инвестиции потребуется сделать в следующем году, чтобы достичь требуемой емкости.
LAN: Насколько можно судить, dcTrack рассчитана на статичное стратегическое управление ЦОД. Между тем современные центры обработки данных требуют и динамического, оперативного управления в реальном времени...
Андерсон: Вы совершенно правы. Но у нас пока нет системы, которая позволила бы автоматически выполнять действия на основании сделанных измерений или каких-либо событий. Мы еще только планируем реализовать такой механизм сценариев.
Впрочем, в нашем решении уже реализована поддержка составления отчетов в реальном времени, и всегда можно узнать, сколько энергии потребляется в данный момент — достаточно взглянуть на экран системы PowerIQ. На основании этих данных можно создавать сообщения о различных событиях — например, если потребление какой-либо стойки превысит предельное значение, то в этом случае будут поданы предупреждения и выключены предопределенные розетки.
Таким образом, речь идет о реализации первого уровня динамического контроля для предотвращения перегрузки. Для сервера можно определить пороговые значения, при наступлении которых его работа будет остановлена. Например, при неожиданном отключения питания будет немедленно сгенерировано событие и другой системе будет направлено сообщение о необходимости взять на себя выполнение сервисов этого сервера с помощью стандартных отраслевых API.
Автоматическое перемещение виртуальной машины с одного сервера на другой пока невозможно, во всяком случае в рамках нашего решения, но это можно сделать путем интеграции инструментария сторонних производителей. Все наши продукты способны генерировать прерывания SNMP, которые могут служить в качестве триггеров других действий и событий. Таким образом, мы не утверждаем, что у нас есть полная система управления, но стремимся достичь этого, тем более что у нас есть вся необходимая информация о событиях для реализации автоматизированной системы контроля. Конечная цель, вы совершенно правы, состоит в том, чтобы ЦОД могли функционировать более или менее автоматически.
Пользователи решают самые разнообразные задачи, и очень трудно разработать ПО, которое удовлетворяло бы всем их требованиям. Именно поэтому наши API являются открытыми и публичными. Независимые поставщики могут воспользоваться решениями Raritan в качестве платформенной технологии, чтобы создать на ее базе специфические для пользователя средства и реализовать динамическое управление.