Люди, у которых слово "RAID" до сих пор вызывало ассоциации только с роем безжалостных ос или средством против тараканов, будут несомненно приятно удивлены. RAID (избыточные массивы недорогих дисков) - это множество в высшей степени полезных принадлежностей, не нарушающих озонового слоя и не повышающих радиационного фона. По оценкам International Data Corp. (IDC), с 1994 по 1995 г. сфера применения RAID-систем увеличилась на 71 процент. Как указывается в подготовленном IDC обзоре "1995 DASD Subsystem Year in Review", эта экспансия приобрела такие размеры из-за расширения рынка открытых систем и мэйнфреймов. По мнению аналитика из IDC Томаса Лейхива, для роста рынка RAID-систем есть множество оснований: пользователи устали терять данные; понизилась стоимость накопителей на жестких дисках; некоторые RAID-системы конфигурируются автоматически; архитектура клиент-сервер берет курс на критически важные приложения; расширились возможности выбора самих RAID-систем; технология RAID больше не кажется опасной. Устройства хранения RAID выпускаются в большом ассортименте. Клиенты могут позволить себе быть довольно разборчивыми при покупке и выбирать то, что на самом деле отвечает их требованиям.
RAID-системы для мэйнфреймов: дорога, которую мы выбираем
Кэйтлин ГеджнRAID-системы для мэйнфреймов постоянно подтверждают свою способность выступать в качестве носителя информации. Пользователи и аналитики подчеркивают, что устройства RAID - самый надежный способ сохранения данных.
Руководитель информационной службы отеля Ramada Milford Plaza Стюарт Шуман, использующий Ramac компании IBM, памятуя об ущербе, который они понесли в результате произошедшей однажды аварии дисковых накопителей предыдущего поколения, считает, что устройства RAID жизненно необходимы в гостиницах, которые работают круглосуточно все семь дней в неделю.
RAID представляет собой класс дисковых массивов, в котором согласованная работа двух или более накопителей обеспечивает повышенную производительность и различные уровни отказоустойчивости и восстановления после ошибок. Большинство RAID-устройств построено на основе стоек (racks) из трех накопителей с емкостью 2 или 4 Гбайт каждый.
Защита данных обеспечивается несколькими способами в зависимости от того, к какому уровню относится используемое RAID-устройство.
Некоторые из этих уровней, например RAID 1 (зеркалирование диска), считаются дорогостоящими, поскольку предполагают стопроцентное дублирование данных, обычно удваивающее стоимость хранения мегабайта информации.
Впрочем, положение меняется. В своем последнем отчете компания Meta Group, занимающаяся исследованиями рынка, прогнозирует заметное снижение цен в последующие два года. Ожидается, что в RAID-системах для высокопроизводительных мэйнфреймов стоимость хранения одного мегабайта информации, равная сейчас 1,74 долл., составит в конце 1998 года 43 цента.
А в нынешнем году на рынке должен произойти решающий перелом. Согласно недавнему отчету IDC, все покупки дисковых запоминающих устройств для IBM-совместимых мэйнфреймов будут связаны в этом году с RAID-системами. По мнению аналитика из Dataquest Фары Йейл, объем поставок RAID-систем должен увеличиваться по мере того, как все большее число компаний начнет заменять ими свои запоминающие устройства IBM 3380 и 3390 c 10-дюймовыми дисками. "Большинство вычислительных центров начнут модернизацию с одной подсистемы. Опробовав технологию RAID, они постепенно приступят к обновлению своего парка запоминающих устройств прямого доступа (DASD - direct access storage device), - говорит Йейл. - Немногие захотят заменить все свои DASD-устройства на RAID-системы одним махом".
Производством RAID-систем для мэйнфреймов занимается только "горстка" компаний: IBM, EMC, Storage Technology, Hitachi Data Systems и Amdahl. Йейл считает, что этот год будет для них относительно спокойным; они займутся, главным образом, поиском путей расширения рынков сбыта. В конце года может произойти некоторое увеличение мощности RAID-систем, однако даже в этом нельзя быть до конца уверенным. Но уже в следующем году, видимо, появятся новые предложения для рынка System/390.
Рынок Unix: ключ для выбора - цена
Джеймс КоннолиНесмотря на банальность слов "больше", "дешевле", "быстрее", именно они дают характеристику RAID для открытых систем в нынешнем году. За те же деньги пользователи могут приобрести гораздо более совершенные продукты - RAID-устройства для ПК- или Unix-серверов.
Конечно, они получают две совершенно новые архитектуры. Однако пользователям здесь не придется выбирать самим: за них это сделают производители систем. Тем не менее неплохо все-таки иметь представление о той производительности, которую предоставляет каждая из систем.
"Учитывая появление на рынке новых приложений типа выдачи видеоинформации по запросу, а также наличие высокопроизводительных систем, можно утверждать, что новые запоминающие устройства будут лучше гармонировать с возможностями процессоров. Функции хранения станут для них меньшей помехой. Большинство пользователей не понимает, что большой объем хранения снижает производительность системы", - говорит Томас Лейхив, аналитик из International Data Corp. Спор идет о том, какие RAID-системы следующего поколения будут основаны на стандарте Fiber Channel Arbitrated Loop (FCAL), предложенном комитетом Fiber Channel Loop Committee, а какие будут базироваться на архитектуре Serial Storage Architecture (SSA), использующей медную проводку.
Компания IBM продвигает SSA и уже предлагает эту архитектуру в своем запоминающем устройстве 7133, которое будет использоваться с серверами RS/6000.
IBM планирует объявить о принятии архитектуры SSA другими поставщиками, а также анонсировать готовность накопителей на базе SSA и RAID-систем для других вычислительных платформ. Оба варианта, FCAL и SSA, построены на основе кольца или петли. Главное отличие между ними состоит в физическом носителе. "Систему на базе SSA можно купить уже сейчас и по меньшей цене. Устройства на основе оптоволоконных соединений появятся через три квартала и будут стоить дороже", - замечает Лейхив. Однако он считает, что через некоторое время цены на SSA и FCAL примерно сравняются. Оба варианта должны работать быстрее, и их реализация будет проще нынешней SCSI-технологии.
Джим Портер, президент компании Disk/Trend, считает, что пользователям в первую очередь следует беспокоиться о возможностях устройств, которые они покупают, а не об архитектуре, лежащей в их основе.
Лейхив перечисляет дополнительные преимущества, на которые, по его мнению, могут рассчитывать пользователи RAID-устройств для открытых систем.
Symmetrix, Iceberg и Ramac: все для покупателей RAID-систем для мэйнфреймов
Кевин БурденПокупатели RAID-систем для мэйнфреймов не избалованы многообразием выбора - всего лишь три главных поставщика да еще "горстка" других, пытающихся прорваться на рынок. Тем не менее покупателям удается найти системы, которые отвечают их потребностям.
Семейство Symmetrix компании EMC известно своей грандиозной производительностью и... высокой ценой. Систему Ramac компании IBM пользователи ценят за ее реализацию конфигурации RAID 5, в которой надежность и производительность гармонично сочетаются с ценой. Iceberg компании Storage Technology отличается чрезвычайно высокой отказоустойчивостью.
Symmetrix
Как отметил Томас Лейхив, прежде чем семейство Symmetrix компании EMC пополнилось системой RAID-S, продукты EMC использовали технологию зеркалирования RAID 1 с наивысшей производительностью среди RAID-систем всех уровней. RAID-S является реализацией RAID-системы 4/5 уровня для мэйнфреймов и открытых систем. RAID 1 копирует все данные, по крайней мере один раз, на отдельный диск. Преимущество RAID 1, с точки зрения быстродействия, обусловлено записью данных на диск как единой совокупности, а не в виде порций, распределяемых по многим дискам. Двадцать из 46 опрошенных пользователей продуктов EMC отметили, что при выборе Symmetrix скорость стала решающим фактором. Этот показатель примерно в два раза выше, чем среди пользователей Ramac и Iceberg. 16 пользователей из двадцати поставили скорости оценку A, остальные - B.
Интерес к надежности также был высок, причем большинство пользователей предпочли надежность скорости. 14 из 19 пользователей, считавших надежность весьма важным фактором, дали ей наивысшую оценку. Однако Symmetrix стоит дорого. Слава Богу, EMC любит торговаться. 18 из 19 пользователей поставили оценку A или B за ту цену, о которой они договорились с EMC.
Iceberg
Пользователи Iceberg заинтересованы в максимальной надежности данных и самой высокой степени отказоустойчивости и менее обеспокоены быстродействием. Iceberg является RAID-системой уровня 6. Это означает, что все данные обновляются по двум схемам четности вместо одной, как в случае Ramac - RAID-системе 5 уровня.
В системе с двойной четностью могут отказать два диска, и это не будет сопровождаться дополнительной потерей данных, что делает системы уровня 6 наиболее отказоустойчивыми среди всех RAID-систем.
Запись в блоки с двойным контролем четности уменьшает быстродействие Iceberg, но, отвечая на вопрос о наиболее важном свойстве продукта, 71 процент пользователей Iceberg назвали отказоустойчивость и только 29 процентов упомянули о скорости.
Iceberg приобрела поклонников и своей потенциальной емкостью. В разговоре о StorageTek больше всего пользователей (восемь) отметили, что общая емкость сыграла значительную роль в принятии решения о приобретении системы. IBM и EMC набрали по три таких пользователя каждая. Среди различных факторов, повлиявших на их выбор, пользователи называли разработанную StorageTek архитектуру Virtual Storage Architecture. Виртуальное запоминающее устройство прямого доступа (DASD) ограничивает интервалы, которые обычные DASD-устройства оставляют между данными для надлежащей работы механизма чтения/записи. Это позволяет повысить фактическую емкость запоминающего устройства.
Ramac
Пользователи Ramac уделяют надежности такое же большое внимание, как и сторонники продуктов StorageTek. Однако они проявляют меньшую готовность пожертвовать скоростью в обмен на приобретение дополнительной надежности. Как и в случае с Iceberg, 40 процентов пользователей Ramac сообщили, что надежность стала для них решающим фактором при выборе системы. Однако, в отличие от Iceberg, получившей положительные оценки от всех 40 процентов своих пользователей, у Ramac нашлись три пользователя, которые поставили ей оценку C.
Скорость для Ramac - вторая по важности черта. Пользователи говорили, что были удивлены скоростью системы, однако их еще сильнее поразило то, что показатели скорости полностью соответствовали значению, обещанному IBM.
В целом, почти три четверти пользователей считают, что Ramac - красноречивое свидетельство того, что IBM слов на ветер не бросает, а 10 процентов даже отметили, что получили больше, чем было обещано.
Цена оказала незначительное влияние на решение пользователей о покупке системы.
Ramac собрала наименьшее количество пользователей (12), указавших, что договорные цены повлияли на их решение, а пять пользователей придерживаются мнения, что цена заслуживает лишь средней оценки.
RAID (redundant arrays of inexpensive disks) - применяется для обозначения массива недорогих дисков с избыточностью. Иногда при расшифровке этого сокращения вместо "inexpensive" употребляется слово "independent" (независимый, самостоятельный). RAID - это группа дисковых массивов, состоящих из двух или более согласованно работающих накопителей, которые обеспечивают повышенную производительность и несколько уровней отказоустойчивости и восстановления после ошибок.
Зеркалирование диска (disk mirroring) - способ избыточной записи данных для обеспечения высокой отказоустойчивости. Данные записываются на две части одного и того же диска, на два отдельных диска одной системы или на две отдельные системы.
Расщепление диска (disk striping) - тип записи информации на RAID-устройство, при котором данные записываются порциями поочередно на каждом диске массива. Массив, созданный таким образом, или RAID-массив уровня 0, обеспечивает высокую производительность ввода/вывода при низкой стоимости. Однако при этом надежность всей системы оказывается ниже надежности любого из формирующих ее дисков.
Бит четности (parity bit) - дополнительный разряд, присоединяемый к байту информации, символу или слову, используемый для обнаружения ошибок передачи данных.
Кэш-память (cache) - специально выделенная высокоскоростная память или зарезервированный раздел обычной (regular) памяти, которая используется для увеличения быстродействия. Для RAID-систем кэш - это очень дорогой способ повышения производительности.
Список основных производителей RAID-систем для мэйнфреймов,
прокомментированный Карлом Грейнером, вице-президентом и директором сервисной службы из Meta Group
EMC Symmetrix
http://www.emc.com
EMC шла так размашисто, что сумела обогнать компании Amdahl, Hitachi и IBM. Подход EMC подразумевал использование кэш-памяти большого объема, что позволило добиться значительного увеличения быстродействия. Для обеспечения высокой готовности EMC применяет методику простого зеркалирования. Недавно EMC выпустила продукт RAID-S, представляющий собой сочетание систем уровней 4 и 5. Компания также дебютировала с сервисными процедурами миграции данных, которые автоматически перемещают данные со старых устройств на новые, причем информация остается доступной для пользователя в течение всего процесса миграции.
IBM Ramac
http://www.ibm.com
В последнее время IBM явно обнаруживала чрезмерную скромность. Единственная ее разработка - простая RAID-система уровня 5, которая не блещет множеством новых функций. IBM много и охотно говорит об устройстве Seastar и архитектуре Seascape, однако их поставки, вероятно, будут производиться не раньше второй половины 1997 или даже начала 1998 года.
STORAGE TECHNOLOGY Iceberg
http://www.stortek.com
StorageTek имеет RAID-систему, относящуюся к уровню 6 и выполняющую сжатие информации при ее перемещении между компьютером и запоминающим устройством. Это дает StorageTek возможность увеличивать емкость хранения в три раза и выше. Оплачивая, например, покупку устройства емкостью 100 Гбайт, вы фактически получаете 300 Гбайт. Storage Tek - это, в сущности, виртуальный диск.
AMDAHL Spectris
http://www.amdahl.com
Amdahl еще не поставляет Spectris и, по-видимому, не будет этого делать до конца первого или даже второго квартала. Spectris является реализацией RAID-системы уровня 3. Уровень 3 хорошо зарекомендовал себя для больших файлов данных при обработке значительных объемов неструктурированной информации. Однако пользователи, как правило, имеют много небольших наборов данных, сформированных на основе информации, содержащейся в базах данных, а в таких условиях надлежащую работу устройства гарантировать невозможно.
HITACHI DATA SYSTEMS 7700
http://www.hdshq.com
Компанию до сих пор лихорадит, хотя постепенно наступает период стабилизации. Устройство 7700 представляет собой сервер с хорошей производительностью и масштабируемостью. Он способен обеспечить потребности на уровне предприятия. К 1997 году он сможет похвастаться производительностью SCSI-устройств. Компания, хоть и с опозданием, все-таки сделала свой первый шаг.
По розничным ценам никто не платит
На рынке RAID-систем действительно никто не платит по розничной цене. Здесь всегда можно договориться с поставщиком, особенно воспользовавшись советами Томаса Лейхива.
Источники информации
Организации The RAID Advisory Board 13 Marie Lane St.Peter, Minn. 56082-9423
(507)931-0967 (507)931-0976 (fax)
http://www.andataco.com/rab
Группа новостей comp.arch.storage
Книги "The RAIDBook" Ключевая книга по RAID-технологии
"The RAIDprimer" Краткое введение в RAID-технологию
Независимые поставщики RAID-систем для Unix
EMC www.emc.com Data General Box Hill Systems |
Andataco www.andataco.com Cambex Storage Dimensions |
Уровни RAID-систем
Здесь представлена краткая характеристика каждого уровня RAID. Важно понять, что RAID 6 не обязательно лучше, чем RAID 0. Уровни просто определяют способ распределения данных по дискам, и конкретную реализацию технологии резервирования данных.
В качестве концепции RAID была впервые представлена в 1987 году инженерами из калифорнийского университета в Беркли, которые описали пять уровней конфигурации RAID (RAID 1-5). С тех пор были добавлены еще два - RAID 0 и RAID 6.
Уровень 0.
Запись данных в виде дорожек поочередно на каждом диске массива без контроля четности.
Уровень 1.
Зеркалирование диска или создание теневой копии. Один рабочий диск и его точная резервная копия.
Уровень 2.
Расщепление данных на массиве дисков на битовом уровне и с контролем четности.
Уровень 3.
Расщепление данных на массиве дисков на байтовом уровне с выделением одного диска на весь набор для контроля четности.
Уровень 4.
Подобен RAID 3, с распределением данных в большие блоки.
Уровень 5.
Распределение данных в последовательные блоки по всем дискам массива с контролем четности.
Уровень 6.
RAID 5, дополненный резервными дисковыми контроллерами, вентиляторами,
шинами и т.п.
RAID 7: ГЛАВНОЕ - УБЕДИТЬ СКЕПТИКОВ
Кевин БурденВ сущности, сделать это нетрудно, если подробно перечислить преимущества ее архитектуры:
Теперь RAID 7 занимает место сразу за устройствами RAID 0-6 и признана комитетом RAID Advisory Board в качестве законного уровня.
Тем не менее RAID 7 нельзя назвать совершенно новым решением. С 1992 года и по настоящее время устройства этого уровня - Storage Server уровня 7 - предлагает единственная компания -Storage Computer (Нэшуа, шт. Калифорния).
Серверы RAID 7 можно реализовать как неотъемлемую часть разнообразных Unix-систем и систем среднего ранга, например в виде настольных систем, стоек и консолей.
Применяя RAID 7, вы получаете высокопроизводительную архитектуру открытых систем, которую пользователи особенно ценят за масштабируемость, скорость и поддержку многоплатформенности.
Приведенные ниже оценки - результат опроса четырех пользователей RAID-систем уровня 7: из компании по разработке системного ПО, университета, нефтегазовой компании и компании по производству телекоммуникационного оборудования. Они оценили серверы хранения по пятибалльной системе: A-превосходный; B-хороший; C-средний; D-плохой; E- очень плохой.
Простота использования: A,B,A,B
Некоторым устройство нравится, другие в него просто влюблены. Что до последних, то особенный восторг у них вызывают средства установки RAID 7. "При инсталляции не приходится листать целые тома руководств, вполне достаточно рекомендаций службы технической поддержки о среде установки. Она не требует также драйверов системного уровня, что позволяет применять более открытую архитектуру сервера", - таково мнение многих участников опроса.
Пользователи, которым устройство всего лишь нравится, тоже упоминают простоту установки, даже при подключении к различным платформам. Однако они поставили ей только оценку B, в частности, из-за неудобств, связанных с реконфигурированием системы. По словам Томаса Лейхива, реализация этой процедуры не отличается от других RAID-систем. Однако, поскольку RAID 7 выполняет конфигурирование внутри себя, старший системный аналитик из Хьюстонского университета Майкл Фредерик, например, ждет, что система будет производить эти изменения "на лету". К тому же RAID 7 не использует освободившееся после удаления разделов пространство автоматически, пользователи должны запрашивать его сами.
Производительность: A,A+A,A
Все опрошенные в восторге от производительности RAID 7, отчасти потому, что она устраняет необходимость использовать более старые запоминающие устройства прямого доступа. Но большинство пользователей находились под впечатлением архитектуры RAID 7. Согласованность RAID 7 означает, что каждый дисковод и интерфейс имеют независимые каналы данных, подсоединенные к высокоскоростной шине данных. Это обеспечивает независимую передачу данных в центральный кэш и из него и, следовательно, исключительную производительность устройства RAID 7.
Фредерик, выполняющий начальную загрузку своих серверов Windows NT c устройства RAID, называет ее скорость "невероятной". "Нашему серверу NT, оснащенному хорошей дисковой системой с интерфейсом SCSI, для начальной загрузки требовалось от 3 до 4 минут. Теперь эта операция завершается за 45 секунд".
Масштабируемость: B+,B,A,A
Консольные модели используют до 48 накопителей общей емкостью до 420 Гбайт. Дополнительные возможности расширения позволяют довести емкость семейства до 1,3 Тбайт.
Как считает Фредерик, масштабируемость устройства можно одновременно назвать и очень хорошей, и весьма ограниченной. К устройству RAID 7 подключается SCSI-накопитель любого производителя. В этом смысле оно масштабируется легко и быстро. Семейство поддерживает 3- и 5-дюймовые диски различных производителей любой емкости. Однако, если в RAID 7 начнут использовать различные накопители, на накопителях наименьшей емкости будут происходить отказы.
Поддержка и сопровождение: B,B-,A,C
"Сопровождение напоминает эксплуатацию тостера: не нужно делать ровным счетом ничего", - говорит Остин. Однако если бы не качество технической поддержки компании Storage Computer, оценки могли бы быть более высокими.
По мнению одного из пользователей, работника нефтегазовой компании, поддерживать системы RAID 7 своими силами намного проще, чем более старые устройства DASD. "В других устройствах при отказе диска приходилось выключать сервер и, отсоединив все SCSI-накопители, удалять плохой, - отмечает он. - Ничего подобного не нужно делать, когда отказывает диск из RAID 7. Достаточно вытащить испорченный диск, вставить новый, и программное обеспечение RAID 7 настраивает его и реконфигурирует всю систему". Устройство RAID 7 можно даже настроить так, чтобы новый диск реконфигурировался после окончания работы пользователей, гарантируя сохранность данных.
Однако компании Storage Computer придется усилить свой персонал поддержки, если она искренне заинтересована в обеспечении своим пользователям минимального комфорта.
Цена: B,B,B,B
Стоимость хранения одного мегабайта информации для RAID 7 оценивается почти в 1 долл. Дорого? Да, ответили трое из четырех пользователей. Но если вспомнить, какие это дает преимущества, можно позволить себе посмотреть на цену сквозь пальцы.