Кришна Натан, вице-президент направления «Объектно-определяемые и файловые системы хранения данных», IBM Systems & Technology GroupНа майской конференции Edge 2014 IBM представила множество решений в области хранения, причем им отводится центральное место в программно определяемом подходе. В основу нового технологического направления положена концепция «эластичного хранения» (Elastic Storage). Компания активно инвестирует в исследования и разработки в таких областях, как обработка новых типов данных в SDS, достижение максимальной производительности за счет использования флеш-памяти, а также оптимизация хранения с помощью виртуализации. О планах по дальнейшему развитию технологий и решений в области СХД в интервью нашему журналу рассказывает доктор наук Кришна Натан, вице-президент направления «Объектно-определяемые и файловые системы хранения данных» IBM Systems & Technology Group.

 

Журнал сетевых решений/LAN: Согласно оценке IDC, на конференции IBM Edge2014 компания представила радикально обновленное видение того, каким будет ее портфель решений STG, при этом в программно определяемом подходе ведущая роль была отведена системам хранения. Как IBM видит будущее программно определяемых систем хранения?

Кришна Натан: Для лучшего понимания предпринятых изменений необходимо представлять контекст, в котором они произошли. Поскольку способ ведения бизнеса меняется, традиционные системы записи дополняются системами взаимодействия. Что понимается под этим? Системы записи — это, ориентированные на транзакции базы данных, инфраструктура виртуальных настольных систем и т. п. Системы же взаимодействия ориентированы на мобильные, социальные, облачные и аналитические приложения. В результате с изменением нагрузки изменяются и требования к ИТ.

Программно определяемый подход — это, по сути, попытка адаптировать системы хранения к требованиям обеих систем: и та и другая должны между собой взаимодействовать. Первые никуда не денутся — пользователям по-прежнему необходимо осуществлять транзакции и решать остальные, уже привычные, задачи, но новые способы ведения бизнеса с использованием социальных сетей и мобильных решений получают все большее распространение. Их надо связать между собой.

Программно определяемые системы хранения играют ключевую роль в системах взаимодействия, потому что необходимы средства для обеспечения масштабирования, получения данных в любой точке мира, работы с огромными массивами информации и ее хранения на разных уровнях вследствие изменения экономики хранения. Все эти факторы стимулируют развитие программно определяемых решений.

 

LAN: Каково решение IBM для реализации SDS? Таковым является Elastic Storage?

Натан: Давайте начнем с определения значения самого понятия «эластичное хранение». Как следует из названия, это нечто масштабируемое. Начав с малого, систему можно масштабировать до бесконечности, во всяком случае в идеале. Для этого нижележащая архитектура должна позволять добавлять сначала емкость, а потом и вычислительную мощность, и сетевые средства, и так далее. Без этого неизбежно возникают узкие места. Иначе говоря, масштабирование должно предусматривать пропорциональное наращивание всех ресурсов.

Кроме того, для реализации эластичного хранения необходимо универсальное пространство имен (Universal Name Space, UNS). В определенном смысле это означает, что, например, в Лондоне, Нью-Йорке и Москве в отделениях одного и того же банка пользователи, при наличии прав доступа ко всем данным, увидят одни и те же данные вместо отдельных их пулов. UNS значительно упрощает сотрудничество. Так, файлы не надо будет передавать, потому что файл доступен только локально и не виден из другого места или же имеет разные названия в разных местах, поэтому приложению необходимо знать не только имя файла, но и его местонахождение.

Далее, существует понятие иерархического хранения (tiering). С увеличением объемов данных множество данных, к которым редко обращаются, нецелесообразно размещать не только на флеш-накопителях, но и на жестких дисках. Такие данные дешевле хранить на ленточных устройствах. Для нас эластичное хранение означает возможность гибко перемещать данные с флеш-накопителей на жесткие накопители, а с них — на ленточные устройства. Миграция должна осуществляться автоматически, чтобы ни приложению, ни пользователю не надо было участвовать в процессе.

Это основные характеристики Elastic Storage.

 

LAN: Каким образом Elastic Storage вписывается в парадигму программно определяемого хранения?

Натан: Один из основных механизмов предоставления Elastic Storage — это полностью программная модель: сначала вы выбираете аппаратное обеспечение, а затем оно конфигурируется с помощью ПО. Иначе говоря, используемое ПО не является специфическим для конкретного оборудования. Специализированные системы хранения (appliance) будут по-прежнему применяться, потому что заказчикам могут потребоваться какая-то нетипичная функциональность и тесная интеграция между компонентами.

Программно определяемые решения появились потому, что многим заказчикам необходимо реализовывать новые функции на существующем оборудовании, а оно может быть каким угодно. Благодаря SDS не придется приобретать новые устройства взамен имеющихся — достаточно их переконфигурировать для реализации дополнительных возможностей. Но программно определяемое решение — это нечто большее, чем реализация функций программным образом. Это возможность иметь API, с помощью которых приложения смогут контролировать систему хранения.

Сегодня приложения могут только записывать/считывать данные с системы хранения. Приложение не имеет возможности дать какие-либо указания — например, «изменить уровень защиты для этих типов данных», чтобы для их хранения использовался RAID6 вместо RAID0. В модели SDS появляются API, так что приложения станут напрямую обращаться к компонентам хранения. Это одно из преимуществ программной модели, потому что с помощью оборудования такое взаимодействие реализовать трудно. Для этого потребовалось бы несколько карт (одна для RAID, другая для ускорения и т. д.), а также возможность менять их динамически.

В случае же программно определяемой модели дело не ограничивается только хранением: программно определяемыми являются и сеть, и вычислительные ресурсы — весь ЦОД целиком. При изменении требований нагрузки пользователь может потребовать еще пять ВМ и три контроллера хранения. И эти три контроллера будут не тремя ящиками, которые потребуется устанавливать в ЦОД, а виртуальными контроллерами, загружаемыми на машины. После этого можно запросить две VPN. И все это делается динамически, что является преимуществом программно определяемых сред.

 

LAN: А какие разработки в области аппаратного обеспечения вы считаете наиболее перспективными?

Натан: Флеш-накопители изменили ситуацию в отрасли, поскольку кардинально меняют всю экономику хранения, особенно из-за значительного снижения цен на эти носители в последнее время. Если взять общую стоимость владения, а не только приобретения и учитывать расходы на обслуживание, питание, охлаждение, площади и стойки, то флеш-накопители окажутся дешевле дисков.

К тому же они позволяют добиться той же самой производительности при гораздо меньшей емкости, тогда как в случае дисковых массивов для достижения требуемой производительности необходимо установить множество дисков, емкость которых используется далеко не полностью — они служат лишь для достижения нужных показателей IOPS.

Распространение флеш-накопителей, а также появление таких технологий, как PCRAM, будут способствовать дальнейшему изменению ситуации на рынке. Кроме того, меняется сама архитектура аппаратных решений — она становится все более распределенной. Такая распределенная архитектура больше подходит для новых типов нагрузки, когда доступ к информации осуществляется из разных мест. Это, в свою очередь, ведет к изменению конфигурации сетей, а хранение все в большей степени начинает рассматриваться как программное решение.

Это те основные изменения, которые я вижу.

 

LAN: Насколько жизнеспособную альтернативу флеш-памяти представляет собой PCRAM? Как далеко продвинулись разработки в этой области?

Натан: PCRAM рассматривается как следующая инкарнация флеш-технологий и представляет собой нечто среднее между флеш-памятью и DRAM, обеспечивая высочайшую производительность и высокую емкость. Такие системы уже поставляются, но, как и при выходе на рынок любой другой технологии, цены пока непропорционально велики, поэтому широкого распространения этих решений можно ожидать только после их удешевления. Думаю, через три — пять лет на кривой принятия инноваций они займут то место, где флеш-накопители были два года назад.

 

LAN: Вы упомянули, что оборудование общего назначения будет использоваться более широко. Означает ли это, что системы хранения станут стандартными, как в свое время серверы стандартной архитектуры?

Натан: Для определенного набора рабочих нагрузок и приложений будет требоваться специализированное оборудование. Например, если банк использует приложение для трейдинга с высокой частотой обращения или что-то подобное, ему понадобится флеш-система с тесно интегрированным программным обеспечением для достижения требуемых параметров производительности. Так что нестандартные системы не исчезнут, но множеству приложений будет достаточно стандартизованного оборудования, особенно для хранения больших объемов данных, — это вопрос емкости и экономичности.

 

LAN: Каковы наиболее интересные предложения IBM в области систем хранения?

Натан: Прежде всего — решения на базе флеш-накопителей. Мы предлагаем самые инновационные продукты, появление которых фактически меняет экономику высокопроизводительных систем хранения. Уже анонсирован новый продукт V840 — флеш-система со всеми возможностями продвинутого контроллера хранения. Она предоставляет разнообразные средства репликации, динамического выделения емкости (Thin Provisioning), сжатия и т. д. Интерес к таким решениям высок, и отмечается значительный рост данного сегмента рынка.

IBM продолжит разработки в этом направлении, поскольку здесь происходят немалые изменения. Плотность становится все больше и больше. Обычно ячейки многоуровневые. В случае флеш-памяти это происходит следующим образом: вместо 0 или 1 она теперь может содержать два бита, то есть имеется уже четыре уровня. При большем числе уровней ячейка содержит три бита и т. д.

С увеличением плотности возникают проблемы с отношением сигнал-шум. При наличии только двух уровней задача выделения сигнала не представляет трудности, но при восьми уровнях разница между ними уменьшается. Поэтому нужны изощренные методы обработки сигналов для извлечения сигнала из шума, чем и занимается наше исследовательское подразделение. Это позволяет повысить плотность и снизить цены.

Нельзя не упомянуть и виртуализацию хранения. Наша линейка SVC занимает лидирующее положение в этой области. Мы продолжаем ее развивать, потому что виртуализация позволяет оптимизировать центр обработки данных для выполнения задач хранения и наилучшим образом использовать имеющуюся емкость.

В результате удается объединить разрозненные системы, когда один контроллер загружен, скажем, на 30%, а другой — на 90%.

Обычно, если где-то не хватает места, добавляется дополнительная емкость. При виртуализации же два разных физических места хранения выглядят для приложения одинаково и добавлять емкость не нужно, поскольку приложение может воспользоваться свободным ресурсом на другом контроллере. Таким образом, виртуализация позволяет оптимизировать инфраструктуру и повысить уровень загруженности. Ряд соответствующих продуктов мы представили во II квартале.

Ленточные накопители продолжают оставаться важным звеном в многоуровневом хранении. Плотность записи на ленточные накопители продолжает увеличиваться. Многие данные вовсе не обязательно хранить на дисках — с экономической точки зрения их целесообразнее перенести на ленту, но нужно обеспечить автоматизацию этого процесса.

Это основные направления, в которых мы работаем.