Однако по мере увеличения сложности инфраструктуры хранения закономерно усложняются процессы управления этой инфраструктурой, эффективного хранения и перераспределения данных между физическими устройствами. Впрочем, эти проблемы выглядят незначительными по сравнению с задачами поиска, анализа и обработки Больших Данных, потребность в эффективном решении которых и будет определять развитие технологий в ближайшем будущем.
Одно из решений возникающих проблем связано с перенесением Больших Данных в облака, что сулит пользователям немало преимуществ. В силу своего объема Большие Данные требуют нескольких систем хранения данных (СХД), вероятно отличающихся реализованными уровнями хранения, и ПО для управления данными. Заказчику эту задачу проще всего реализовать в парадигме облачных вычислений, переложив все заботы об инфраструктуре хранения на провайдера и получив унифицированный интерфейс доступа к данным с заранее оговоренными параметрами соглашения об уровне обслуживания (Service Level Agreement, SLA).
Конечно, при переносе данных в облако неизбежно встает вопрос информационной безопасности. Для его решения в облаке должны применяться технические средства, ориентированные на защиту самих данных, а не их периметра. Кроме того, облака начнут активно использоваться для хранения конфиденциальной информации, персональных данных, и т. п. лишь после готовности соответствующей нормативно-правовой базы.
Появление в облаке Больших Данных выводит на новый уровень проблему управления ими, поскольку традиционные инструменты, такие как реляционные базы данных, недостаточно эффективны. Остроту этой проблемы можно снизить путем подбора оптимальных инструментов хранения, например объектных хранилищ, которые сейчас активно развиваются применительно к облакам. Можно ожидать, что провайдеры публичных облаков смогут предложить разные типы хранилищ, в том числе специально ориентированные на Большие Данные.
В России Большие Данные сегодня можно встретить в крупных медиа- и интернет-компаниях. В обоих случаях существуют специфические для данной отрасли решения. Отказ от них в пользу частных облаков сопряжен с немалыми затратами на перенос соответствующего ПО в облачную среду, тогда как преимущества хранения данных в облаках (виртуально неограниченная масштабируемость, контролируемые параметры SLA) проявляются в полной мере лишь при использовании публичных облаков.
Вячеслав Медведев,
cистемный архитектор,
компания «Инфосистемы Джет»