«Открытые системы»
Сотрудники EMC впервые в России в деталях представили систему долговременного хранения больших объемов данных EMC Centera
В обстоятельной трехчасовой лекции, прочитанной консультантом компании EMC Хельмутом Готше, были раскрыты функциональные возможности и особенности использования дискового накопителя Centera. Помимо лекции он провел сеанс демонстрации этого первого представителя нового класса устройств, попадающих в категорию контентно-адресуемых систем хранения (Content Аddressable Storage, CAS). Семинар собрал весьма представительную аудиторию, что свидетельствует о двух связанных между собой обстоятельствах. Во-первых, рынок систем хранения в России достиг такого уровня развития, при котором существуют крупные организации, способные купить подобного рода элитные решения. Не секрет, пока CAS-решения от EMC устанавливаются только в крупных центрах обработки данных, и во всем мире продано порядка 4 тыс. систем Centera, но надо учесть, что для устройств данного класса подобная цифра значительна, она подтверждает успех компании. Во-вторых, продвижение Centera свидетельствует о прочности положения EMC на отечественном рынке: теперь представительство компании способно не только предложить пользователям «тяжелые» решения, но и осуществить весь комплекс связанных с этим мероприятий.
С практической точки зрения устройства Centera остаются интересными ограниченному кругу крупных организаций, однако их появление следует признать знаковым событием для рынка в целом, а последствия — далеко идущими. Этот дисковый массив оказался первым из накопителей, специально предназначенных для хранения фиксированного контента, что делает его уникальным |
С практической точки зрения устройства Centera остаются интересными ограниченному кругу крупных организаций, однако их появление следует признать знаковым событием для рынка в целом, а последствия — далеко идущими. Этот дисковый массив оказался первым из накопителей, специально предназначенных для хранения фиксированного контента, что делает его уникальным. Вполне естественно, что нарушитель статус-кво всегда подвергается критике, если не остракизму, со стороны конкурентов. Не стал исключением и продукт EMC. Впрочем, один из основных упреков, адресованных Centera, а именно привязанность к ограниченному кругу прикладных программных интерфейсов, предлагаемых EMC, следует признать вполне логичным. С другой стороны, как можно требовать стандартизации от устройства, которое появилось на рынке первым и тем самым стимулировало появление и развитие нового сегмента. Понимая эту особенность Centera, EMC предложила несколько способов решения проблемы ограниченности по линии API.
Сегодня уже более 200 популярных приложений поддерживают Centera API, есть способ интеграции, основанный на специализированном программном инструментарии Universal Access, который обеспечивает взаимодействие по традиционным протоколам NFS, CIFS, FTP и HTTP, и, наконец, интерфейс Centera API опубликован и может использоваться в самостоятельно разработанных приложениях.
Изменившиеся прогнозы
Если сегодня у десяти экспертов спросить, каким им представляется будущее систем хранения, то, без всякого сомнения, в результате опроса будет получено более десяти разных ответов. Возможно, подобная неопределенность естественна для момента, когда буквально все, прямо и косвенно связанное с системами хранения, переживает бурный количественный и качественный рост. На глазах меняется система приоритетов, еще несколько лет назад эволюция накопителей (и дисковых и ленточных) представлялась как линейный процесс, аналитические предсказания сводились к приросту объемов, выраженному в петабайтах и последующих единицах измерения. Однако на деле оказалось, что рост объемов действительно наблюдается, но обеспечен вовсе не теми привычными транзакционными данными, хранимыми в реляционных СУБД, к работе с которыми прекрасно адаптированы существующие технологии.
Спрос на объемы хранения оказался стимулирован в первую очередь такими данными, которые теперь принято называть «неструктурированными», и в новых условиях важнейшей задачей становится архивация фиксированного контента, то есть разного рода текстов, изображений и других файлов с «медийным» содержанием. Для подобных данных важны не только задачи резервного копирования, но в большей степени архивирования и сохранения на долгие годы. Устройства, родословная которых ведется от транзакционных приложений, на роль архиваторов не годятся, нужны альтернативные накопители.
Как ни странно, но при ближайшем рассмотрении становится очевидным, что ИТ-индустрия в целом оказалась не готовой к работе с неструктурированными данными. Это утверждение относится не только к производителям систем хранения, но и к компаниям, занимающимся программными средствами для управления хранением, и к разработчикам СУБД. Более того, дело не только в технологиях; до сих пор нет адекватных теоретических работ, развивающих инженерную теорию информации (философскую и кибернетическую тем более оставим в стороне).
Вот на таком фоне и были представлены накопители Centera. Есть все основания считать, что вместе с ним появилось на свет следующее поколение дисковых накопителей, которое станет третьим по счету в истории этого класса оборудования. Первым поколением были непосредственно подключаемые к серверам диски (Direct Аttached Storage, DAS). Второе поколение стартовало в 1992 году, когда компания Vinca предложила идею сетей хранения (Storage Area Networking, SAN), кстати, впоследствии отцом SAN признали Джея Карлсона, прежнего президента Vinca. Несколько позже не существующая сегодня компания Auspex предложила накопители, подключаемые к сети (Network Attached Storage, NAS). Среди технологий, претендующих на то, чтобы дать жизнь третьему поколению, можно назвать унифицированные сетевые системы хранения (Network Unified Storage, NUS) и файловые системы с прямым доступом (Direct Access File Systems, DAFS).
Одна из наиболее интересных идей, на основе которых могут быть построены системы хранения для неструктурированных данных, получила название «объектные системы хранения» (Object-Based Storage, OBS); реализуется с помощью нескольких дополняющих друг друга технологических приемов.
Объектные системы хранения отличаются принципиально новым подходом к хранению и адресации. Вместо привычных логических томов и блоков, которые с помощью файловой системы связываются в файлы, объектом хранения становится в чистом виде определенная порция данных, а в качестве средства для адресации к этому объекту используется специальный идентификатор, выработанный по тому или иному алгоритму, выбранному авторами конкретного решения. Иначе говоря, по набору данных генерируются присущие этому и только этому набору метаданные. Пока не существует строгих, сформировавшихся представлений об объектных системах хранения; в качестве носителя, на котором размещаются объекты, можно представить себе и отдельный диск с объектной адресацией, и устройство типа NAS, однако впервые на практике идеи объектного хранения были реализованы в дисковых массивах CAS.
Своим появлением устройства Centera обязаны крошечной бельгийской компании FilePool, купленной EMC в 2001 году, и ее директору по технологиям Полу Карпентеру (четыре патента Карпентера являются ядром CAS в исполнении EMC). Сегодня Карпентер развивает идеи CAS, работая в компании Caringo, поставившей на рынок программный продукт CAStor. Именно он предложил использовать хорошо известный криптографам 128-разрядный хеширующий алгоритм MD5 (Message-Digest algorithm 5) для формирования образа хранимого объекта. Любое изменение в содержании объекта приведет к созданию совершенно иного образа. Наличие метаданных позволяет развести функции доступа к архивным данным и служебные функции, связанные с поддержанием сохранности архива.
Массив Centera самостоятельно решает задачи хранения и управления данными, обеспечивает защиту данных от аппаратных сбоев, от ошибок ИТ-администраторов и от неверных действий приложений. Для защиты объектов внутри системы хранения действует система дублирования данных Content Protection Mirroring и защита по четности Content Protection Parity, представляющая собой аналог RAID-5. Кроме того, наличие образа метаданных гарантирует их неизменность в процессе хранения.
Не менее интересна и аппаратная реализация Centera. Массив собирается из двух типов узлов, один из них отвечает за обработку запросов со стороны приложений (Access Node), второй — за хранение (Storage Node), все узлы связаны внутренней сетью и, естественно, задублированы, система не имеет единственной точки отказа. Узел хранения содержит четыре диска ATA-II по 0,5 Тбайт каждый. Масштабирование обеспечивается тем, что минимальная конфигурация может быть четырехузловой, следующий уровень — «куб», содержит 16 узлов. Два куба монтируются в одну стандартную стойку. Всего же в кластер может быть включено до восьми кубов. У сегодняшних заказчиков потребности в большем объеме не возникало, при необходимости число кубов в кластере может быть увеличено. В EMC гарантируют, что будут осуществлять поддержку всех когда-либо выпущенных систем Centera.
«Centera не имеет равных для сохранения финансовой и секретной информации, не допускающей искажения», — подчеркнул Готше.
О высокой степени защищенности может свидетельствовать следующий факт: Centera является в данный момент единственной системой, сертифицированной Комиссией по ценным бумагам и Минобороны США для хранения данных, искажение которых не допускается.