.
Корпорация Microsoft разработала несколько инструментальных средств, которые помогают администраторам определять потребности в ресурсах хранения данных, в частности Exchange Storage Calculator (http://msexchangeteam.com/archive/2007/01/15/432207.aspx) и Jetstress (http://technet.microsoft.com/en-us/exchange/bb330849.aspx). Они позволяют представить потребности организации в количественном выражении (http://www.iometer.org/). Имеются и другие бесплатно распространяемые средства, например Iometer. Перед тем как остановить свой выбор на том или ином решении, четко определитесь с тем, как вы будете использовать ресурсы хранения данных. Это позволит сэкономить время и средства.
Системы хранения с прямым подключением Direct Attached Storage (DAS) применяются уже десятки лет. Их нередко используют при эксплуатации Exchange Server в малых и средних компаниях и все чаще можно встретить в организациях уровня предприятия. Рассматривая возможность применения систем DAS в вашей среде Exchange, исследуйте различные варианты использования массивов RAID, а также важность применения нескольких дисков.
Сети устройств хранения данных Storage Area Networks (SAN) представляют собой надежные и хорошо масштабируемые централизованные ресурсы хранения данных. Они функционируют в собственных независимых сетях, а для взаимодействия между различными дисками и соединения хостов применяются каналы связи на базе технологии Fibre Channel (FC). Недостаток этого решения в том, что оно дороже и сложнее в реализации, нежели другие варианты. Программные средства для решений SAN, как правило, стоят дороже, чем для массивов DAS, и обычно поставляются отдельно от аппаратных компонентов, тогда как массивы DAS часто поставляются с набором утилит.
iSCSI — протокол хранения, используемый для подключения сетевого устройства. Он применяется для подключения к сетевому устройству, которое перемещает сведения, связанные с хранением данных. Протокол дает клиентам возможность пересылать команды SCSI удаленным консолидированным целевым средствам хранения (или дисковым массивам) таким же образом, каким клиент может взаимодействовать с локально присоединенным диском. Многие полагают, что iSCSI можно передавать по существующей инфраструктуре локальной сети. Технически это возможно, однако поступать так не рекомендуется. Устройства iSCSI обходятся дешевле, чем Fibre Channel, но, как бы то ни было, вам придется использовать выделенные аппаратные компоненты и кабели. И уж, по крайней мере, вам потребуется выделенная виртуальная локальная сеть, а ваши устройства должны быть расположены относительно близко друг к другу — использование протокола iSCSI в каналах региональной распределенной сети нецелесообразно.
NAS или iSCSI?
iSCSI иногда ошибочно связывают с NAS. Но хотя системы хранения данных iSCSI подключаются к сетям TCP/IP так же, как и сетевые хранилища данных Network Attached Storage (NAS), система iSCSI отнюдь не то же самое, что традиционное хранилище NAS. NAS — это тип устройства, а не протокол. NAS использует стандартные сетевые протоколы, такие как Server Message Block (SMB) и Microsoft Windows Network, для того чтобы эмулировать устройство хранения данных. Что же касается iSCSI, то это настоящий протокол хранения данных, который поддерживается для развертывания Exchange.
Традиционная технология NAS в системе Exchange 2007 не поддерживается, о чем говорится в блоге команды разработчиков Exchange. Даже в системах Exchange 2003 Microsoft поддерживает использование только тех NAS-устройств, которые прошли сертификацию в лаборатории Microsoft Windows Hardware Quality Labs. Лично у меня нет опыта успешной работы с каким-либо из продуктов NAS, и, если вы решили отдать предпочтение этой технологии, узнайте у вашего поставщика, предназначено ли для использования с продуктом Exchange 2003 избранное вами сквозное решение.
DAS: дешево и сердито
Неудивительно, что средства DAS столь часто используются в системах хранения данных Exchange Server: это самое дешевое и самое эффективное с точки зрения производительности из трех решений, рассматриваемых в данной статье. Технология DAS предполагает использование одной главной системы и лучше всего подходит для небольших и средних компаний. Правда, в процессе масштабирования решений при наличии большого числа пользователей возникают значительные проблемы. Если у вас есть потребность в увеличении количества дисков для обеспечения дополнительного пространства и повышенного быстродействия, DAS-решения не позволят удовлетворить эту потребность с такой же легкостью, как решения SAN.
Как организовать управление средствами DAS в долгосрочной перспективе? Это еще один вопрос, которому вы должны уделить внимание в процессе принятия решения. Помните, что существует несколько факторов, определяющих расчет стоимости хранения данных, и один из них — это капитальные затраты. DAS-решение может показаться недорогим, если учитывать только первоначальные вложения, но следует помнить, что в расчет принимаются и расходы на управление в процессе эксплуатации.
Чем больше имеется дисков в системе DAS, тем больше операций ввода-вывода выполняется за одну секунду и тем выше производительность по операциям ввода-вывода. Размер индивидуальных дисков определяет объем хранимых данных, но коэффициент ввода-вывода будет намного выше при использовании RAID-массива, состоящего из 10 накопителей емкостью по 180 Гбайт, чем при работе с массивом, состоящим из шести накопителей по 300 Гбайт. Зависимость между объемом дискового пространства и пропускной способностью при выполнении операций ввода-вывода не является линейной.
Использование массива RAID с отказоустойчивостью может привести к росту накладных расходов и снижению производительности, но вы сможете, установив в массиве дополнительные диски, повысить скорость выполнения операций ввода-вывода в дополнение к повышению отказоустойчивости. Затраты на такой массив вполне оправданны, если иметь в виду, что этот вариант решает проблему постоянных потерь данных и потенциальных простоев для конечного пользователя.
SAN: дорогостоящая, сложная и исключительно добротная система
SAN — это лучшая технология централизованного хранения данных для тех, кого не останавливают ни высокая цена, ни значительный уровень сложности. Системы SAN отличаются высокой пропускной способностью и превосходной отказоустойчивостью, причем отказоустойчивость характерна не только для дисковых массивов, но и собственно для соединений. Наличие нескольких каналов передачи данных обеспечивает возможность обращения к требуемому хранилищу в любой ситуации. Кроме того, решения SAN отличаются высоким уровнем масштабируемости — они могут взаимодействовать с несколькими главными системами, и в случае возникновения такой необходимости вы можете добавлять новые тома или расширять существующие средства хранения.
В SAN-решениях традиционно применяются соединения Fibre Channel, но для многих малых предприятий эта технология не вполне подходит: она обходится дорого и требует большой работы по настройке. Мой опыт свидетельствует о том, что хорошо подготовленные инженеры встречаются очень редко. Принимать таких специалистов на постоянную работу для обслуживания инфраструктуры средств хранения данных — значит идти на дополнительные расходы, а обучение операциям развертывания и обслуживания требует больших временных затрат. Поставщики средств SAN обычно оказывают услуги по настройке и первоначальной установке своих продуктов, но эти услуги могут вам дорого обойтись, особенно если вы работаете в изменяющейся среде.
К сожалению, полнофункциональных кроссплатформенных инструментальных средств, способных взаимодействовать со всеми марками устройств SAN, не существует. Поэтому, для того чтобы свести к минимуму возможность осложнений, лучше всего работать с определенным набором продуктов и с одним поставщиком. Так вы облегчите жизнь и себе, и вашим сотрудникам, ответственным за обслуживание систем Exchange, ведь каждый поставщик средств SAN использует собственные, несколько отличающиеся от других конфигурации для создания и представления средств хранения главным системам. Кроме того, собственно средствам SAN придется, вероятно, взаимодействовать с различными серверами, функционирующими под управлением разных операционных систем.
Во многих компаниях средства SAN используются не только для работы с системами Exchange, но и с другими программами, такими как SQL Server или SharePoint. Это может приводить к снижению затрат на эксплуатацию средств хранения SAN для систем Exchange, поскольку такие затраты распределяются по нескольким приложениям, но мой опыт подсказывает, что почти во всех системах Exchange следует использовать диски, не привлекаемые к работе с другими приложениями. Мне часто попадались клиенты, которые пытались задействовать одни и те же диски для решения разных задач и обнаруживали, что установленные у них средства SAN не в состоянии обслуживать операции ввода-вывода Exchange плюс операции ввода-вывода других систем с помощью одного и того же набора дисков.
Системы SAN, оснащенные средствами iSCSI: альтернатива технологии Fibre Channel
Системы SAN, оснащенные средствами iSCSI, представляют собой менее дорогостоящую альтернативу технологии Fibre Channel, к тому же они могут эксплуатироваться как в крупных, так и в небольших компаниях. Средства iSCSI SAN настраиваются с главной машины или с самого устройства, а значит, они не слишком сложные. Средства iSCSI SAN сопоставимы с Fibre Channel в том, что касается безопасности транспортировки данных. Соединения могут аутентифицироваться или шифроваться; нужно только, чтобы и система-инициатор, и целевая система поддерживали соответствующие протоколы. Недостаток этого решения состоит в том, что технология iSCSI не всегда обеспечивает такое же быстродействие, как Fibre Channel, но все же благодаря своей универсальности и более низкой цене решения на базе iSCSI пользуются большей популярностью.
Возможно, для оптимизации быстродействия есть смысл задействовать аппаратный вариант iSCSI или адаптер с TCP/IP Offload Engine (TOE). Адаптер TOE iSCSI дает возможность поручить выполнение почти всех операций по обработке процесса коммуникации процессору и памяти самого адаптера. В этом его отличие от чисто программных решений iSCSI, которые могут просто «захлебнуться» в условиях больших нагрузок.
Массивы RAID
RAID — это широкий термин для обозначения схем организации хранения данных, в которых данные распределяются по нескольким дисковым накопителям и дублируются на дисках. Данные распределяются по массиву дисков, но пользователи и операционная система воспринимают этот массив как единый объект.
Выбирая и проектируя решения RAID для своей системы Exchange Server, постоянно держите в памяти два показателя: объем дискового пространства, которое вам понадобится, и максимальное время на восстановление, приемлемое для вашей компании в случае выхода массива из строя. Для восстановления массива RAID с более вместительными дисками потребуется больше времени, чем для массива с дисками меньшего объема, а на восстановление дисков Serial ATA (SATA) уйдет больше времени, нежели на восстановление дисков Serial Attached SCSI (SAS). Добавление к массиву дополнительных дисков тоже приведет к увеличению времени восстановления. Существует несколько уровней массивов RAID, которые могут быть использованы в системах Exchange Server:
В массиве RAID уровня 0 данные разделяются и распределяются по нескольким дискам. В таком массиве вы можете использовать все диски на полную мощность — два диска емкостью по 300 Гбайт обеспечат хранение 600 Гбайт данных. Массивы RAID 0 обеспечивают высокую производительность, так как позволяют одновременно записывать данные на все диски, но их недостаток в том, что эти массивы не обеспечивают отказоустойчивости. В случае отказа одного из дисков массива RAID 0 весь массив выйдет из строя, и вы потеряете все данные на всех дисках. По этой причине уровень RAID 0 не рекомендуется к использованию в имеющих жизненно важное значение бизнес-приложениях.
RAID 1 — это набор дисков с зеркальным дублированием. Массивы RAID 1 состоят из четного числа дисков, и все данные, записанные на один диск, дублируются на другом; в итоге, если один диск выходит из строя, данные не теряются. RAID уровня 1 подходит для разделов, предназначенных для операционных систем и журналов баз данных Exchange. Именно на таких массивах чаще всего записываются журналы регистрации транзакций. Недостаток такой схемы состоит в том, что, если некоторые устройства с уровнем RAID 1 позволяют одновременно считывать данные с двух дисков, что приводит к сокращению времени считывания, массивы с зеркальным дублированием не дают возможности повысить скорость записи данных по сравнению с использованием одного диска. Кроме того, в конфигурациях RAID 1 возможно использование только половины емкости дисков, так как все данные записываются дважды.
Массивы RAID 0+1, как явствует из их названия, представляют собой сочетание массивов уровней RAID 0 и RAID 1. Данные в них распределяются по разным дискам и в то же время дублируются, что обеспечивает отказоустойчивость и повышение производительности. Уровень RAID 0+1 обходится довольно дорого, так как в их состав входят дублирующие диски (всего требуется не менее четырех дисков — два диска с чередующимися данными и две их зеркальные копии), но повышение отказоустойчивости и производительности обычно вполне компенсируют дополнительные затраты и сложность решения. Матрицы RAID 0+1 чаще всего используются для баз данных Exchange.
Еще один довольно распространенный вариант организации дисковых массивов в системе Exchange Server — массив RAID уровня 5. RAID 5 — это набор дисков с чередованием, в котором защита от потери данных обеспечивается с помощью контроля по четности. В массиве уровня RAID 5 данные распределяются по всем дискам; в случае отказа одного диска данные не утрачиваются, но ни один из дисков массива не является дубликатом другого диска. Быстродействие системы RAID 5 примерно в три раза ниже, чем в уровнях RAID 1 и RAID 0+1, потому что для выполнения каждой записи операционной системе требуется три записи на диск. Вместимость массива RAID 5 уменьшается — общая емкость матрицы RAID 5 равна емкости всех входящих в ее состав дисков минус емкость одного из этих дисков. Эти обстоятельства — меньшая вместимость массива RAID 5 плюс ее пониженная производительность — могут служить аргументами в пользу другого варианта.
Чтобы определить, какой уровень RAID больше подходит для конкретной среды, следует оценить, какой эффект та или иная система RAID окажет на число операций ввода-вывода, выполняемых вашей системой накопителей за одну секунду. RAID уровней 1 и 0+1 не оказывают влияния на этот показатель, но производительность массива RAID уровня 5 составит всего лишь одну треть от соответствующего показателя иной, отличной от RAID 5 системы. На стадии проектирования важно проанализировать все варианты RAID или обратиться к специалисту, который сможет разъяснить вам тонкости проектирования архитектуры средств хранения. Обязательно протестируйте системы хранения данных с помощью инструментов, предлагаемых поставщиками средств хранения (или продуктов, упомянутых мною в начале статьи), и удостоверьтесь в том, что эти системы удовлетворяют вашим требованиям.
Хранилища, отвечающие запросам бизнеса
Важнейшее соображение, которым следует руководствоваться при выборе средств хранения данных Exchange Server, состоит в следующем: система хранения должна отвечать вашим бизнес-запросам. Каждый вариант имеет свои плюсы и минусы. К примеру, не используйте неподдерживаемую версию NAS, а если вы можете выделить на приобретение системы хранения весьма ограниченные средства, не останавливайте свой выбор на FC SAN. Не забудьте все как следует проверить перед тем, как переводить новую дисковую систему в производственную сеть. Я рекомендую выполнить всестороннее тестирование с помощью программы Jetstress.
Скорее всего, один из рассмотренных выше вариантов окажется работоспособным решением, соответствующим требованиям вашей среды по производительности, масштабируемости и бюджету, вне зависимости от того, какую версию Exchange вы используете. Мне было бы интересно узнать, как вы преодолеваете практические сложности и совершенствуете инфраструктуру средств хранения данных Exchange, так что присылайте мне свои вопросы и комментарии по электронной почте.
Что важно знать об Exchange 2010
Тип дисков
В версии Exchange 2010 реализованы дополнительные усовершенствования механизма использования системы хранения данных. Пользователи Exchange 2007 часто применяли высокоскоростные диски FC или SAS, обеспечивающие выполнение большого числа операций ввода-вывода в секунду (IOPS). IOPS-профиль Exchange 201 существенно ниже, чем у более ранних версий продукта, поэтому необходимость в обеспечивающих более высокую производительность дисках FC или SAS отпала.
Типы массивов RAID
Реализованное в Exchange 2010 новое средство Databases Availability Group (группа доступности баз данных) дает возможность использовать варианты, не требующие применения на сервере массивов RAID. Чтобы предоставить потребителям еще один вариант, разработчики добавили новую конфигурацию, известную как «просто несколько жестких дисков» — Just a Bunch Of Disks (JBOD). JBOD организуется за счет репликации баз данных уровня приложения, как часть функциональных возможностей DAG.
Расчет IOPS/памяти
При использовании Exchange 2010 важнее, чем когда-либо прежде, выделять время для оценки нужного объема памяти и производительности системы хранения, необходимых для развертывания. Exchange 2010 предъявляет гораздо более высокие требования к памяти при обслуживании больших почтовых ящиков по сравнению с предыдущими версиями, и во всех проектах развертывания Exchange 2010 необходимо следовать рекомендациям производителя, а также выполнять окончательную проверку корректности с помощью тестовых инструментов Microsoft.
Влияние решений независимых поставщиков
Сегодня, когда в среде Exchange все активнее используются различные приложения, часто приходится сталкиваться с системами Exchange, не обладающими достаточными ресурсами по той причине, что их проектировщики не учли эффекта от применения продуктов сторонних фирм. В процессе проектирования системы Exchange 2010 обязательно проследите за тем, чтобы были учтены потребности всех приложений от независимых поставщиков. Беспроводные устройства, разработанные специалистами сторонних компаний, надстройки для программы Outlook и другие компоненты оказывают влияние на общую производительность сервера Exchange.
Ли Дьюмас (lee.dumas@azaleos.com) — директор по архитектуре в компании Azaleos, предоставляющей услуги по управлению Exchange, имеет сертификат Microsoft Certified Architect