Вне всякого сомнения, обеспечение доступности наиболее важных приложений является приоритетной задачей администраторов баз данных. Разумеется, главную роль всегда играет производительность системы, но, когда приложения и сама база данных недоступны, этот показатель отступает на второй план. Если база данных выходит из строя, администратору понятно, чем следует заняться. Обеспечение высокой доступности не просто одна из целей предприятия. И хотя уровень обеспеченности ресурсами малых и средних предприятий может быть различным, их потребности в доступности жизненно важных приложений во многом совпадают.
Простои обходятся дорого
Для предприятий и крупных организаций, эффективность которых напрямую зависит от функционирования критически важных приложений, простои — это не просто неудобство или помеха в работе. Простои могут оборачиваться очень большими финансовыми потерями. Понятно, что фактические объемы убытков могут быть разными в зависимости от характера бизнеса и типа используемых приложений. Но вот какое обобщение я встретил в любопытном обзоре, опубликованном специалистами исследовательской фирмы Gartner Research: в среднем минута простоя обходится коммерческим организациям примерно в 5600 долл., что составляет свыше 300 тыс. долл. в час. Здесь речь идет всего лишь о неких усредненных значениях, однако они ясно показывают, что простои чувствительно бьют по интересам всех организаций. Некоторые компании несут даже более серьезные потери. Вот пример: однажды в 2013 году сеть корпорации Amazon бездействовала в течение 30 минут. По оценкам специалистов, сумма упущенной выручки Amazon составляла 66 240 долл. за минуту, или примерно 3 млн долл. за все время простоя. Да, совершенно ясно: простои обходятся дорого, но их последствия проявляются не только в денежном выражении. Простой — это еще и ущерб репутации, потеря значимости в глазах клиентов и конечных пользователей, а также снижение эффективности в период, когда организация возвращается к нормальной работе после аварийного сбоя.
Обеспечение доступности в масштабах предприятия на базе платформы HPE Superdome X
Доступность не приходит сама по себе. Ее нужно встраивать в инфраструктуру, что называется, с нулевого цикла. К примеру, когда вы работаете над формированием аппаратного уровня инфраструктуры, важно понимать, что с точки зрения доступности не все серверы одинаковы. Когда вы выбираете серверную платформу, следует обращать внимание на встроенные средства обеспечения надежности начиная с уровня компонентов и до уровня решения. С целью защиты от незапланированных простоев платформа HPE Superdome X предусматривает обеспечение уровня доступности «пять девяток» (99,999%). Проведенные специалистами HPE исследования показали, что Superdome X обеспечивает 60-процентное сокращение простоев по сравнению с «масштабируемыми вширь» решениями. Подобным же образом реализованная в HPE Superdome X уникальная функция nPar (аппаратное разделение) по показателю надежности на 20% превосходит решения на базе программной виртуализации. На уровне микропрограммного обеспечения Superdome X реализует архитектуру firmware first, которая локализует ошибки в микропрограммах еще до того, как поврежденные данные попадают в операционную систему. Кроме того, встроенный процессор анализа ошибок Error Analysis Engine (EAE) постоянно исследует все возможные отказы оборудования, прогнозирует ошибки и может в автоматическом режиме инициировать действия по восстановлению системы без вмешательства оператора. Этот многоуровневый подход к обеспечению надежности позволяет максимально продлевать период безотказной работы систем и способствует повышению их доступности.
Повышение доступности баз данных с помощью групп доступности AlwaysOn SQL Server
Далее необходимо составить план действий по обеспечению защиты базы данных. Реализованные в SQL Server группы доступности SQL Server AlwaysOn Availability Groups (AG) — это главная технология SQL Server, поддерживающая доступность баз данных. Такие группы могут одновременно обеспечивать как высокую доступность нескольких баз данных, так и их восстановление после аварийного сбоя. Группы доступности AlwaysOn обеспечивают защиту на уровне баз данных и могут защищать как от плановых, так и от внезапных простоев. Такие группы могут осуществлять защиту нескольких баз данных, причем все эти базы могут быть автоматически организованы в отказоустойчивые структуры. Они могут осуществлять автоматический переход на другой ресурс, причем время аварийного переключения обычно составляет всего несколько секунд. Число дополнительных реплик, с которыми взаимодействуют группы доступности AlwaysOn SQL Server 2016, может достигать восьми; при этом каждая дополнительная реплика размещается на отдельном узле отказоустойчивого кластера Windows. Группы доступности AlwaysOn могут одновременно поддерживать как синхронные, так и асинхронные реплики. Синхронные реплики используются в случаях, когда необходимость обеспечения высокой доступности сочетается с требованием быстрого аварийного переключения в автоматическом режиме. Асинхронные реплики обычно применяются при восстановлении данных после аварийного сбоя, когда реплики размещаются в различных географических точках или в «облаке».
Новое в группах доступности AlwaysOn SQL Server 2016
В системе SQL Server 2016 реализован ряд новых возможностей для групп доступности. В версии SQL Server 2016 Standard Edition будут предусмотрены двухузловые группы доступности. Далее, SQL Server 2016 будет поддерживать до трех синхронных реплик, две из которых можно будет использовать в качестве целевых в процессе автоматического аварийного переключения. Кроме того, группы доступности SQL Server 2016 будут поддерживать службу «координатор распределенных транзакций» Distributed Transaction Coordinator (DTC) для Windows Server 2016. И наконец, группы доступности SQL Server 2016 будут обеспечивать балансировку нагрузки на пространстве дополнительных реплик.