Население планеты уже составляет 7,8 миллиарда человек и продолжает расти. Сегодня все больше людей работают из дома. Такие технологии, как интернет вещей (IoT), периферийные вычисления, искусственный интеллект (ИИ), быстро набирают обороты. Растет спрос на потребительские устройства. Все эти факторы приводят к увеличению объемов корпоративных данных. По прогнозам, суммарный объем данных к 2025 году может вырасти до 175 зеттабайт. Сейчас за час создается больше данных, чем за целый год всего два десятилетия назад.
Проблемы эффективного использования данных
По прогнозам, в следующие два года объем корпоративных данных будет ежегодно увеличиваться на 42,2%. В условиях беспрецедентного роста объема данных они перемещаются в разнообразной экосистеме, которая включает мультиоблака и периферию. Это усложняет управление данными, а большинство данных предприятий остаются неиспользованными. При этом только 32% данных, доступных предприятиям, будут реально задействованы, говорится в отчете Seagate Rethink Data.
Основными задачами становятся обеспечение сбора необходимых данных, возможности использования собранных данных, безопасности, управления хранением и консолидации разрозненных хранилищ данных.
Где создаются и где хранятся данные?
Поскольку корпоративные данные не хранятся в одном месте, управлять ими становится все сложнее. Результаты опроса Seagate показывают, что примерно 30% данных находится во внутренних ЦОД, 20% — в сторонних центрах обработки данных, 19% — в периферийных дата-центрах или на удаленных площадках, 22% — в облачных репозиториях и 9% — в других местах. У предприятий будет расти потребность в управлении этими разрозненными активами.
По прогнозам IDC, количество новых данных, созданных в мире, в 2025 году достигнет 175,8 Збайт (по сравнению с 18,2 Збайт в 2015 году). Объем хранимых корпоративных данных к 2025 году составит 9 Збайт, тогда как в 2015 году он не превышал 0,8 Збайт. Опрос Seagate Rethink Data подтверждает эту тенденцию: в организациях постоянно расширяются возможности сбора и хранения корпоративных данных. Использование аналитики, распространение устройств IoT, инициативы по миграции в облако — три наиболее важных фактора, влияющих на рост объема хранимых данных.
Где создаются и хранятся данные?
Как раскрыть потенциал данных?
Обзор Seagate Rethink Data также показал, что большую часть бизнес-данных организации не используют. Хотя данные представляют реальную ценность, она часто остается незамеченной. Кроме того, по оценкам респондентов, организации собирают только 56% данных, а это означает, что они упускают почти половину данных. Причем лишь 32% данных, доступных предприятиям, были задействованы. И это несмотря на то, что данные все чаще используются для выявления новых источников дохода, улучшения качества обслуживания клиентов и повышения операционной эффективности.
У организаций есть множество возможностей для более эффективного использования данных и получения конкурентных преимуществ. Ценность данных зависит от множества факторов, включая отрасль, в которой они созданы, цель, которой они служат, а также то, будут ли они в конечном итоге монетизированы и как.
DataOps в помощь
Решением многих проблем управления данными является DataOps — дисциплина, соединяющая создателей данных с их потребителями. Лишь 10% организаций сообщают, что полностью внедрили DataOps на своем предприятии. При этом большинство опрошенных говорят, что принципы DataOps «очень» или «чрезвычайно» важны. Наряду с другими решениями для управления данными, DataOps приводит к ощутимо лучшим результатам для бизнеса: повышению лояльности клиентов, доходов, прибыли и получению множества других преимуществ.
Необходимо сделать собранные данные пригодными для использования, управлять их хранением. Использование подходящей среды хранения для различных наборов данных, правильная классификация данных на основе взаимодействия между создателями данных и владельцами бизнеса, постановка целей для различных типов данных, обеспечение сбора необходимых данных, защита данных, а также преобразование собранных данных в пригодные для использования данные — всё это задачи DataOps. Хотя многие организации достаточно продвинулись во внедрении DataOps и относительно хорошо осведомлены, необходимо больше опыта и практики в этой дисциплине, чтобы лучше использовать имеющиеся данные. Все больше данных хранятся в облаках, что требует особых подходов.
Проблемы управления данными в мультиоблачных средах
Нередко приходится управлять данными, размещенными в нескольких облаках. Исследование Seagate показывает равное распространение как мультиоблачных сред, так и гибридных облаков (по 37%). Использование гибридных облаков обычно определяется приложениями.
Мультиоблачные и гибридные облачные среды решают целый ряд проблем. Они могут упростить доступ к данным и их анализ, сократить расходы на хранение, предоставить администраторам лучший контроль и повысить уровень безопасности данных. Но такие экосистемы создают определенные проблемы управления данными. Управление данными в мультиоблачных средах — задача номер один на ближайшие два года. Управление данными в гибридных облаках считается второй по важности задачей, отмечается в исследовании Seagate.
Инновации в хранении и ценность данных
То, как и где хранятся данные, может значительно влиять на пользу, которую организации смогут извлечь из них. Инновации в области хранения данных напрямую влияют на ценность данных для бизнеса. Большая емкость хранения способствует экономии за счет масштаба. Результаты аналитики улучшаются по мере роста наборов данных, к которым получают доступ аналитические инструменты. Прорывы в области искусственного интеллекта и машинного обучения также невозможны без доступа к большим массивам данных. Поэтому производители СХД стараются увеличить плотность хранения. Сейчас примерно 90% данных хранятся на жестких дисках, а 10% — на устройствах флеш-памяти (SSD).
Еще одно направление инноваций — увеличение пропускной способности систем с целью обеспечить более надежное перемещение данных между системами хранения, сетями и уровнем вычислений. Это важно для задач аналитики. Безопасность, защита данных — еще одна область инноваций. Системные решения выигрывают от безопасности на уровне компонентов и устройств.
«Ограничения, накладываемые на раскрытие всего потенциала данных, носят как системный, так и оперативный характер. Когда объемы данных измеряются зеттабайтами, нужен простой, безопасный и недорогой способ сбора, хранения и применения данных», — считает Дейв Мосли, генеральный директор Seagate Technology. Учитывая эти требования, Seagate разработала новую систему хранения высокой плотности, сравнимую по эффективности с хранением данных в облаке.
Система хранения с функциями самовосстановления
Объемы данных растут постоянно и очень быстро, в отличие от ресурсов на их обслуживание. Поэтому необходимы решения для простого и надежного хранения больших объемов данных. Новая линейка СХД Seagate нацелена на удовлетворение таких потребностей и представляет новую категорию «умных» систем хранения данных.
Система хранения Seagate Exos CORVAULT с функциями самовосстановления построена на платформе Seagate Exos 4U106. Эта высокопроизводительная СХД с высокой плотностью хранения разработана для развертывания в центрах обработки данных и на периферии. Блочная СХД имеет емкость до 1,9 Пбайт, обеспечивает доступность на уровне «пять девяток» и эффективно масштабируется. Поддержка нескольких хостов дает возможность не создавать разрозненные хранилища и консолидировать данные. Технология Seagate ADAPT позволяет распределять данные по всем дискам массива CORVAULT. Благодаря этому обеспечивается высокая производительность сразу всех дисков, их быстрое восстановление и надёжность, снижение издержек и более быстрая перестройка массивов по сравнению с RAID.
«Регенерация» дисков
Уникальная система самовосстановления Autonomous Drive Regeneration (ADR) повышает надежность СХД и сводит к минимуму необходимость вмешательства человека. ADR позволяет «на лету» переводить большинство накопителей в рабочее состояние путем их перенастройки и реконфигурации для обхода неисправных компонентов. Эти накопители не придется заменять вручную, снижается потребность во вмешательстве человека, а это экономит время и деньги. При сбое диска производительность системы падает незначительно (менее чем на 10%), а стирающее кодирование (Erasure Coding) позволяет получить заданный уровень защиты от потери части данных.
Самокорректирующаяся система Exos CORVAULT, разработанная компанией Seagate, способна самостоятельно вернуть большинство накопителей в надежное рабочее состояние.
СХД CORVAULT не является ни JBOD-, ни RAID-массивом, но обеспечивает высокую производительность массива хранения и простоту JBOD. ADR работает совместно с технологией ADAPT, заменяющей традиционный RAID схемой защиты с распределением четности по большему количеству жестких дисков. При этом поддерживаются и традиционные RAID 50/60, но технология ADAPT при большом количестве дисков дает максимальный эффект. Кроме того, ADAPT позволяет работать с накопителями разной емкости, что помогает эффективно использовать диски после самовосстановления.
Технология ADR не только минимизирует время простоя, но и уменьшает количество компьютерных отходов за счет восстановления сбойных накопителей. Поскольку накопители восстанавливаются, а не выбрасываются, уменьшается вредное воздействие на окружающую среду.
Надежность, безопасность и простота управления
Корпус высотой 4U вмещает 106 накопителей Seagate Exos X18 SAS емкостью 18 Тбайт, защищенных от вибрации, перегрева и сбоев питания. В системе CORVAULT используются резервируемые сдвоенные контроллеры с возможностью горячей замены, построенные на основе обновленной специализированной интегральной микросхемы (ASIC) шестого поколения VelosCT.
Резервируются практически все элементы системы: вентиляторы, контроллеры, блоки питания (и шины питания внутри них), шины SAS к каждому диску и т. д. Такая архитектура, исключающая единую точку отказа, в сочетании с программными технологиями и обеспечивает уровень доступности «пять девяток», а это очень высокий показатель для данной ценовой категории. Блоки питания, накопители, контроллеры и вентиляторы также предусматривают возможность горячей замены и обеспечивают непрерывную работу системы во время обслуживания оборудования.
Скорость последовательного чтения/записи у СХД достигает 14 и 12 Гбит/с соответственно, а число операций ввода/вывода в секунду (IOPS) — 17 680. Для развертывания, настройки системы и управления ею можно использовать графический веб-интерфейс или интерфейс командной строки. Она поддерживает также удаленную диагностику и обновление в фоновом режиме.
Характеристики системы
Эффективность и масштабируемость | Максимальная плотность — 1,9 Пбайт данных в корпусе 4U и новейшие технологии жестких дисков позволяют получить эффективность хранения на уровне облачных сервисов. |
Архитектура системы | Избыточные контроллеры с поддержкой горячей замены, работающие по схеме «активный/активный», микросхема VelosCT ASIC шестого поколения, технология защиты данных с помощью стирающего кодирования ADAPT значительно сокращают накладные расходы, повышают производительность, оптимизируют управление и восстановление. |
Производительность | Последовательное чтение — 14 Гбайт/с, последовательная запись — 12 Гбайт/с, 17 680 операций ввода-вывода в секунду (IOPS). |
Число накопителей | До 106 накопителей Exos X18 с интерфейсом SAS и технологией самошифрования. |
Защита данных | Стирающее кодирование Seagate ADAPT или RAID 5, 6. |
Надежность | Проверенная архитектура с уровнем доступности данных 99,999%. Технология автономного восстановления накопителей (ADR) снижает необходимость вмешательства со стороны человека за счет автоматического восстановления накопителей «на лету». |
Компоненты с поддержкой функции горячей замены | Восемь сменных плат расширения, две на систему из 24 жестких дисков, накопители, вентиляторы, блоки питания. |
Емкость системы | 1,908 Пбайт полной емкости. |
Порты ввода-вывода главного устройства | Четыре порта mini-SAS HD на контроллер (всего 8). |
Типы интерфейсов | 10/100/1000 Ethernet. |
Поддерживаемые протоколы | SNMP, SSL, SSH, SMTP, HTTP(S). |
Консоли управления | Графический веб-интерфейс или интерфейс командной строки, программное обеспечение для управления. Информативная дистанционная диагностика и обновления упрощают обслуживание. |
Безопасность | Технология Seagate Secure. Накопители с технологией самошифрования обеспечивают наивысший уровень безопасности без дополнительных накладных расходов. Протокол SFTP для безопасной передачи файлов. Конфигурация FIPS 140-3 (по запросу). |
Из повседневной работы компаний видно, насколько важно хранить данные и использовать их полный потенциал. Однако в условиях быстро меняющегося информационного мира, в котором используются различные системы облачного и периферийного хранения данных, это непростая задача. К тому же она осложняется взрывным ростом объемов данных и потребностью в их быстром анализе. Компании оказываются в сложном положении из-за недостатка ресурсов и технологических ограничений: им приходится постоянно менять ИТ-инфраструктуру и принципы управления данными.
Многие компании стремятся держать свои данные «у себя», но за счет облачного хранения могут снижать затраты, контролировать средства защиты, задержку и доступ к данным. Это ведет к повышению спроса на локальные СХД. Эффективное хранение данных требует все более технологичных и совершенных систем.
По данным IDC, российский рынок СХД в 2020 году составил 564,3 млн долл., увеличившись с 508,09 млн долл. в 2019 году. Рост спроса стимулирует в том числе развитие цифровой трансформации. Увеличение объема данных повышает стоимость их хранения, поэтому все более актуальными будут становиться экономически эффективные решения, способные оптимизировать вложения в ИТ-инфраструктуру.