Ответам на эти вопросы и посвящена данная статья.
Не всегда легко сказать, насколько эффективным будет применение SAN в конкретной организации, из-за разнообразия применяемых технологий и различий в сложности сетей устройств хранения. Например, к SAN можно отнести старое устройство Dell 650F, с которым я работал несколько лет назад. Оно располагало соединением Fibre Channel, и я использовал его в качестве общего хранилища данных для трехузлового кластера. Однако в нем не было функций репликации, динамической балансировки нагрузки, а возможности расширения были ограниченны. С тех пор определение SAN стало более широким и охватывает два основных типа устройств.
В Fibre Channel SAN для подключения устройств хранения используется волоконная оптика (в редких случаях медный кабель). Для каждого узла SAN необходим хост-адаптер (HBA) Fibre Channel, и в большинстве Fibre Channel SAN используется волоконно-оптический коммутатор для организации соединений между узлами. Скорости Fibre Channel составляют от 1 Гбит/с до 4 Гбит/с, а дальность передачи при правильной прокладке кабеля — до 100 км.
iSCSI SAN — сравнительно новый, более экономичный способ организации SAN. Вместо волоконной оптики или медного кабеля в iSCSI SAN используются обычные сетевые кабели и протокол TCP/IP. Преимущества довольно очевидны: доступная цена и повышенная гибкость. Вместо существенных затрат на адаптеры Fibre Channel HBA и коммутаторы можно применить недорогие адаптеры Gigabit Ethernet HBA (которые, в сущности, представляют собой обычные сетевые платы) и коммутаторы, а расстояние между устройствами SAN легко увеличить, не прибегая к помощи экскаватора.
В любом случае основными достоинствами SAN остаются гибкость, производительность и возможность обеспечить высокую отказоустойчивость и непрерывное функционирование предприятия. Рассмотрим каждое из этих преимуществ отдельно.
Гибкость SAN достигается благодаря наличию многочисленных физических дисков, которые можно объединять в различных конфигурациях. Например, набор из 21 диска можно превратить в единый массив RAID-5 из 18 дисков с тремя дисками горячего резерва, два массива RAID-5 из девяти дисков с тремя дисками горячего резерва или один мощный массив RAID-1+0 (хотя отказываться от резервных дисков жалко). Теоретически из этих конфигураций можно составить любую необходимую комбинацию логических томов, выбрав число дисков и тип RAID каждого тома для конкретного применения. На практике это не всегда удается, как будет показано далее в статье.
Производительность SAN определяется двумя основными факторами: большим числом физических дисков и кэшем большой емкости. В зависимости от набора приложений в SAN, числа дисков и способа их организации, преобладающим может быть любой из этих факторов. Оценивая потенциальную производительность SAN, следует учитывать, что на практике рабочие показатели SAN в значительной степени зависят от конфигурации.
Даже если SAN используется только как большой массив RAID, высокая отказоустойчивость и непрерывность деятельности предприятия достигается благодаря возможности перемещать данные между узлами SAN. Кроме того, SAN существенно облегчает получение копий в конкретный момент, с использованием службы Microsoft Volume Shadow Copy Service (VSS) или фирменных механизмов поставщиков. А репликация между устройствами SAN обеспечивает дополнительную избыточность и гибкость (хотя при потенциально более высоких затратах).
SAN часто развертываются в сочетании с кластерами, но это не обязательное условие. Общая сеть SAN для нескольких не объединенных в кластер серверов почтовых ящиков обеспечивает все перечисленные выше преимущества без сложностей кластеризации. Сама SAN достаточно сложна, и именно по этой (оправданной) причине организации, которым были бы полезны повышенная производительность и гибкость, иногда отказываются от внедрения SAN. Если на предприятии трудно установить и обслуживать сеть устройств хранения, зачастую лучше вообще отказаться от SAN.
Необходимо принять во внимание и цену. Затраты на каждое решение зависят от конкретных обстоятельств, но в любом случае возможности SAN обходятся недешево. Затраты на приобретение и обслуживание — одна из основных причин, сдерживающих распространение SAN; многим организациям выгоднее потратить деньги на развитие других компонентов инфраструктуры.
Однажды Марк Твен сказал, что разница между верным словом и метким словом такая же, как между светлячком и ударом молнии. Поэтому я хочу продолжить рассмотрение характеристик SAN, которые делают устройства хранения пригодными для конкретных применений. Речь пойдет о некоторых особенностях настройки SAN для Exchange.
Прежде всего, следует принять во внимание число дисков. Компания Microsoft давно рекомендует назначать отдельные физические диски для журналов транзакций и данных почтовых ящиков. Выпуская Exchange 2000, компания дополнила эту рекомендацию советом использовать по возможности отдельные физические диски для каждого набора .edb- и .stm-файлов в каждой группе хранения. То же самое относится и к SAN: если можно выделить физические диски для Exchange, поместив их в логические тома, относящиеся только к Exchange, то производительность Exchange повысится. Не все инженеры компаний-поставщиков одобряют такой подход; даже если инженер настойчиво предлагает использовать общие диски, делать этого не следует. Необходимо отметить, что иногда разделение дисков неизбежно; порой трудно оправдать затраты на покупку дорогостоящих дополнительных дисков ради сомнительного выигрыша в производительности.
Следующий фактор — конфигурация RAID. Предположим, что для Exchange требуется память емкостью 2 Тбайт. Получить такой объем памяти можно несколькими способами; рассмотрим три комбинации — массив RAID-5 из шести дисков по 400 Гбайт, массив RAID-1+0 из 16 дисков по 250 Гбайт и массив RAID-5 из 15 дисков по 146 Гбайт. Цена приобретения шестидискового массива самая низкая, но и его производительность будет невелика из-за малого числа дисков; кроме того, из-за малого числа накопителей снижается отказоустойчивость. Цена 16- и 15-дисковых массивов примерно одинаковая, но их рабочие характеристики могут быть иными — не из-за числа дисков, а в силу структуры ввода/вывода, для которой оптимизирован каждый тип RAID.
Третий фактор — объем. Поставщики SAN часто ссылаются на показатели производительности или инструмент Exchange 2003 Jetstress, демонстрируя быстродействие при малой нагрузке на диски. Контроллер SAN и кэш показывают более высокие результаты, когда занят лишь малый процент дискового пространства, но картина может оказаться иной в производственных условиях, если предприятие не располагает множеством физических дисков и не размещает данные так, чтобы на каждом диске оставалось как можно больше свободного места. Это все равно что хранить носки в 25 ящиках комода, по одной или две пары в каждом, — не очень разумно. Как правило, с течением времени диски заполняются, поэтому тестирование производительности следует проводить с заполненными дисками (оптимальный вариант — 70 или 80%).
Компании Dell и HP предлагают калькуляторы хранилища, с помощью которых можно оценить число необходимых дисков и их конфигурацию для заданного числа пользователей. Полученные результаты можно использовать как отправную точку при планировании конфигурации. Однако нельзя гарантировать определенный уровень производительности Exchange и SAN, если не учитывать три приведенных выше фактора. Это не означает, что при малом числе дисков, неподходящем уровне RAID и сильно загруженных дисках производительность будет недостаточной. Просто уровень производительности будет нестабильным, и предприятию придется вкладывать средства в решение проблем, которых можно было бы избежать.
Поль Робишо - Главный инженер компании 3sharp, имеет сертификаты MCSE и Exchange MVP. Автор нескольких книг, в том числе The Exchange Server Cookbook (издательство O?Reilly and Associates), и создатель Web-узла http://www.exchangefaq.org. troubleshooter@robichaux.net