Появление видео-конференц-связи, IP-телефонии, а также повышение требований бизнес-критичных приложений к пропускной способности каналов повысили актуальность соглашений об уровне обслуживания. Насколько востребованы SLA на российском рынке телекоммуникационных и информационных услуг и с какими сложностями приходится сталкиваться клиентам при переходе к управляемым соглашениям SLA?

 

Тема SLA стала интересовать руководителей, аналитиков и директоров в области ИТ и телекоммуникаций пять – семь лет назад. В 2008 году Лорен Гиббонс Пол опубликовал в CIO Magazine свою статью «Все, что вы хотели знать о SLA» (см. русский перевод в апрельском номере журнала «Директор информационной службы» за 2008 год).

Прежде в сетях IP передавался трафик приложений, для работы которых качество каналов связи не критично. Ввиду отсутствия средств контроля и правовых механизмов, операторы готовы были фиксировать в договорах на услуги связи любые требования клиента в отношении показателей качества. Если и попадался дотошный заказчик, пытавшийся определить реальную скорость подключения путем измерения времени скачивания файлов из сети или другими программными средствами, оператор всегда мог сослаться на несовершенство нормативной базы и отказать в претензии.

Появление видео-конференц-связи и IP-телефонии (VoIP), а также повышение требований бизнес-критичных приложений к пропускной способности каналов повысили актуальность соглашений об уровне обслуживания (Service Level Agreement, SLA). Клиенты стали более пристально вчитываться в указанные в договорах цифры, изучать методы контроля оговоренных параметров, обсуждать вопросы правомерности и точности измерений. А в последнее время участились случаи предъявления штрафных санкций операторам за ненадлежащее оказание услуг.

Однако процесс установления четких взаимоотношений между поставщиками и потребителями инфокоммуникационных услуг на основании SLA по-прежнему наталкивается на множество подводных камней, которые могут стать причиной возникновения конфликтных ситуаций. Сегодня мы попытаемся дать ответы на вопросы, чаще всего задаваемые клиентами операторов связи на семинарах и конференциях.

ПРАВОМЕРНОСТЬ РЕЗУЛЬТАТОВ МОНИТОРИНГА SLA

Могут ли результаты измерений качества услуг использоваться в рамках судебного разбирательства? Этот вопрос довольно часто интересует потребителей инфокоммуникационных услуг. Ответ: да, могут, ведь SLA, как и любой другой договор, имеет юридическую силу, но при этом надо учитывать ряд ограничений.

Во-первых, между потребителем и поставщиком услуг должно быть подписано соглашение об уровне обслуживания, в котором четко оговариваются показатели качества услуги, методы и средства их измерения, правила расчета и оценки, схемы включения измерительных устройств.

Во-вторых, мониторинг качественных показателей должен выполняться так, как описано в SLA. Соглашение должно содержать название конкретного прибора (список приборов) или системы, результаты измерений которых принимаются обеими сторонами.

Важным условием является использование сертифицированных средств измерения. Однако следует помнить, что применение средств измерений с метрологическим сертификатом требует периодической поверки каждого прибора/зонда, без которой данный сертификат недействителен.

По этой причине сертификат важен не менее, чем подписанные договоренности в SLA. Используемые средства измерения должны предоставлять релевантную информацию обеим сторонам. В противном случае SLA не достигнет своей цели, а послужит генератором конфликтных ситуаций.

Непосредственно перед заключением SLA целесообразно провести независимую экспертизу на предмет правомочности предлагаемых методик и средств измерения. Правильно составленный договор SLA позволит защитить потребителя и поставщика услуг в случае судебного разбирательства.

КАКИЕ ПОКАЗАТЕЛИ КАЧЕСТВА УСЛУГИ ДОЛЖНЫ УКАЗЫВАТЬСЯ В СОГЛАШЕНИИ?

Набор показателей, характеризующих качество услуги, является важной составной частью соглашения об уровне обслуживания. Какие показатели качества должны быть указаны для той или иной услуги, как они должны рассчитываться и какие нормы применимы к этим параметрам?

Набор показателей IP-соединения можно считать устоявшимся — это процент потери пакетов и пакетов с ошибками, задержка передачи пакета и ее вариация. Перечисленные технические показатели относятся к показателям производительности услуги. Методики расчета указанных показателей подробно описаны в соответствующих стандартах и рекомендациях (ITU-T Y.1540, Y.1561, RFC 2544, RFC 3550, MEF 10.2 и т. д.). Необходимо определиться с выбором конкретного метода и указать его в соглашении SLA.

Не столь однозначна ситуация с вычисляемыми показателями качества, такими как готовность (SA), среднее время между отказами (MTBF) и среднее время восстановления (MTTR). Например, значения готовности могут сильно различаться в зависимости от метода их расчета: что принимать за отказ, отказ какой минимальной длительности следует считать таковым, включать ли периоды согласованных регламентных работ на сети в общее время оказания услуги, как учитывать периоды деградации качества услуги и автоматические исключения при загрузке клиентского порта более чем на 80%. Все эти нюансы должны быть четко описаны в SLA.

КАК ОПРЕДЕЛИТЬ НОРМЫ ДЛЯ ПАРАМЕТРОВ КАЧЕСТВА КАНАЛОВ СВЯЗИ?

Как известно, услуга Ethernet — интегральная, но у разных пользователей — разные ожидания. Ethernet для видео-конференц-связи (ВКС) не то же самое, что Ethernet для корпоративной почты. Различная реализация вендорами сетевого и периферийного оборудования, применение криптомаршрутизаторов и защищенных соединений вносят свою лепту в общую картину.

В рекомендации МСЭ-Т Y.1542 приведены нормы на технологические параметры качества IP-соединений. В Приказе Министерства информационных технологий и связи РФ от 27 сентября 2007 года № 113 «Об утверждении требований к организационно-техническому обеспечению устойчивого функционирования сети связи общего пользования» устанавливаются аналогичные нормы. Роскомнадзор совместно с ЦНИИС и НИИР разработал и подготовил для утверждения в Минкомсвязи методики контроля качества телематических услуг (в части широкополосного доступа в Интернет), в которых содержатся нормы параметров качества. К сожалению, «в чистом виде» они не пригодны для применения в корпоративных сетях, а в ряде случаев даже не способны обеспечить нормальную работу информационных системы и корпоративных средств видео-конференц-связи. Например, требования к пропускной способности системы Teleрresence на несколько порядков отличаются от требований системы Skype.

Поэтому на практике используется подход «сверху вниз» — от потребностей вышележащих пользовательских сервисов к требованиям в отношении качества транспортной сети. При согласовании параметров SLA целесообразно решить вопрос о том, как нормы для параметров качества критичных сервисов будут проецироваться на качество арендуемых услуг в реальных условиях эксплуатации, например при установке шифрующих маршрутизаторов.

Проведенные лабораторные исследования показали, что на качество сервиса видео-конференц-связи (ВКС) одного из производителей влияют только потери пакетов в сети. Допустимый диапазон составляет от 0 до 0,5% потери пакетов (см. Рисунок 1). В связи с тем, что у систем ВКС большой буфер обмена, задержка и ее вариация (jitter) фактически не оказывают влияния на качество ВКС.

Рисунок 1. Допустимый диапазон потери пакетов при видео-конференц-связи.
Рисунок 1. Допустимый диапазон потери пакетов при видео-конференц-связи.

 

КАКИМ ДОЛЖЕН БЫТЬ РАЗМЕР СКИДКИ ЗА НАРУШЕНИЕ SLA

Договор SLA представляет собой соглашение, где описывается организационно-техническое взаимодействие контрагентов на всех этапах жизненного цикла услуги — от подключения до отказа от нее. Таким образом, успешность взаимоотношений между поставщиком и потребителем услуги напрямую зависит от прозрачности содержания договора, особенно если речь идет о конфликтной стороне вопроса — невыполнении обязательств по SLA. В разделе соглашения SLA о нарушениях должны быть четко разграничены зоны ответственности: что является нарушением SLA, как оно фиксируется и, главное, какой размер скидки предполагается за то или иное нарушение.

В практике западных компаний применяются различные модели расчета скидок (компенсаций) за нарушения SLA. При этом каких-то универсальных величин компенсаций не существует, но есть общий подход и примеры из практики. Методологический подход заключается в том, что потребитель старается заложить в размер компенсаций риски финансовых потерь по причине неработоспособности арендуемой услуги. Исходя из этого, поставщик услуги определяет размер «наценки» за услугу с такими обязательствами. В реальных соглашениях широко применяются два вида расчета скидок: линейная модель и более жесткая прогрессивная.

Линейная модель скидок довольно проста: за каждый полный интервал времени (например, 30 мин или час) неготовности услуги предоставляется определенная скидка. На российском рынке наиболее часто встречается так называемая модель 1/720, в соответствии с которой за каждый полный час простоя формируется скидка в размере 1/720 от абонентской платы за услугу, так как в месяце 720 ч.

Прогрессивная скидка призвана компенсировать финансовые риски в случаях, когда критичные процессы или услуги компании напрямую зависят от арендованной услуги. При таком подходе общее время неготовности разбивается на интервалы (например, от одной минуты до часа, от часа до двух часов, от двух часов до четырех часов и т. д.) и для каждого определяется размер скидки, который всецело зависит от того, насколько арендованная услуга критична для ведения бизнеса.

Так, например, в Таблице 1 отображена модель расчета скидок в типовых договорах SLA международного оператора связи AT&T.

Таблица 2. Модель расчета компенсаций за услуги IP VPN компании AT&T в 2005 году.
Таблица 1. Модель расчета компенсаций за услуги IP VPN компании AT&T в 2005 году.

 

Следует отметить, что скидка за нарушение SLA не является для потребителя самоцелью, ведь он покупает услугу не для экономии, а для развития своего бизнеса. Объем затрат на услуги связи редко превышает 5% от общих расходов компании, и оптимизация затрат в этой области не принесет глобального успеха. Размер скидки рассматривается пользователем исключительно как механизм воздействия на оператора с целью не допустить отрицательного влияния низкого качества услуг на состояние дел в компании.

ОТЧЕТНОСТЬ SLA

Анализ соответствия качества услуги за определенный период нормам SLA является кульминацией всего процесса под названием «управление SLA». Важность этого этапа сложно переоценить, ведь от его результата зависят взаимоотношения между контрагентами. Некорректно сформированный отчет SLA может привести к конфликту, финансовым потерям и даже уходу ключевых клиентов как у одной, так и у другой стороны.

Вопросы о содержании отчетов SLA, о периодичности их формирования и форме возникают часто. Отчеты SLA не имеют каких-либо особых ограничений и универсальных форм. Как часть соглашения SLA, они являются продуктом взаимопонимания сторон. Однако выделить общие рекомендации по их оформлению все же возможно.

Во-первых, отчет SLA должен содержать информацию о контролируемой услуге и периоде оценки:

  • номер и сроки действия договора;
  • наименование поставщика и потребителя услуги;
  • временной интервал (период), за который он был сформирован;
  • версию отчета, если в него были внесены изменения.

Во-вторых, в отчете должны быть приведены значения параметров качества, определенных договором SLA. Это могут быть абсолютные и относительные значения — в частности, готовность услуги обычно выражается в процентах (например, 99,85%), а дополнительно может быть указано, что услугой нельзя было пользоваться определенное количество времени в течение отчетного периода.

Обычно в отчете SLA информацию принято раскрывать постепенно, то есть на первых страницах (или экранных формах) отображается общая информация о соответствии качества услуг SLA (достигнут или нет общий показатель готовности), а далее предоставляется расшифровка значений (декомпозиция). Это могут быть средние, минимальные и максимальные показатели качества за период или процентное соотношение нахождения услуги в нормальном состоянии или в состоянии деградации.

Для большей наглядности отчеты SLA в электронной или печатной форме зачастую сопровождаются круговыми диаграммами и столбчатыми гистограммами. Агрегация и декомпозиция интервалов оценки могут быть выбраны произвольно, но целесообразно отражать динамику изменения показателей. Например, для ежемесячного отчета значения показателей рекомендуется формировать за каждый конкретный день, а для ежедневного отчета — за каждый час.

В-третьих, при анализе качества услуги и соответствия уровня обслуживания нормам SLA должны учитываться периоды согласованных планово-профилактических работ по обслуживанию сети и периоды исключений. Например, в договорах отечественных операторов часто оговаривается, что для гарантии качественных показателей услуги средняя полезная нагрузка пользовательского трафика не должна превышать 80% гарантированной пропускной способности. Соответственно, периоды превышения заданного значения должны быть исключены из отчетов.

Ответственным за формирование отчета SLA обычно является контрагент, владеющий программно-аппаратными средствами измерения и мониторинга качества, то есть это может быть как оператор SLA, так и потребитель инфокоммуникационных услуг. Важно, чтобы в договоре SLA четко обозначался временной интервал, в течение которого отчет SLA должен быть сформирован и предоставлен обеим сторонам (например, в течение одного рабочего дня после окончания отчетного периода).

ЧЕМ ОТЛИЧАЕТСЯ ОТКАЗ ОТ ДЕГРАДАЦИИ КАЧЕСТВА

Наиболее частыми вопросами при составлении и применении SLA являются определение граничных значений и интерпретация понятия «отказ услуги» — одного из ключевых положений концепции управления качеством инфокоммуникационных (и не только) услуг и SLA как такового.

Для того чтобы понятие качества услуги обрело метрологический характер, должны быть определены показатели производительности услуги (KPI), такие как процент потерянных пакетов, время задержки передачи пакета по сети и ее вариация и т. д., а также формируемые на их основании показатели качества (KQI): готовность услуги (Availability), время между отказами (Mean Time Between Failure) и т. д.

Состояние услуги определяется на основании соответствия значений KPI пороговым значениям в течение заданного периода. Обычно принимают, что если средние значения KPI не превышают пороговых значений, то услуга считается предоставленной, в противном случае фиксируется отказ. Для мониторинга приложений реального времени и критичных для бизнеса сервисов такой подход обоснован, однако для широко распространенных услуг передачи данных он не подходит безоговорочно.

Проблема заключается в определении понятия «отказ», то есть в установлении обоснованных норм на KPI. Так, отказом может считаться только полное прекращение коммутации пакетов (80–100% потери пакетов при передаче). В таком случае при некоторых значениях показателей качества сервис может стать малопригодным для использования (частые обрывы сеансов и повторные подключения, низкая скорость работы приложений и т. д.), но при этом оператор не будет отвечать за низкое качество арендованной услуги. И наоборот, слишком жесткое определение параметров отказа может быть не согласовано оператором по причине невысокого приоритета услуги передачи данных по отношению к другим услугам.

Для решения этих проблем вводят определение деградации качества услуги как промежуточного состояния. Во-первых, деградация сигнализирует об ухудшении качества услуги, что может позволить предупредить серьезные нарушения SLA, во-вторых, штрафные санкции за нахождение услуги в этом состоянии значительно мягче, чем в случае отказа (например, компенсации за деградацию качества могут включаться в расчет только при нахождении услуги в деградировавшем состоянии более суток или двух).

ДЕМАРКАЦИЯ КАК ОТПРАВНОЙ ПУНКТ SLA

Одним из самых важных шагов на пути установления SLA является четкое разграничение зон ответственности за качество арендуемой услуги. Исходя из нашего опыта, при отсутствии SLA и контроля за ним подавляющее большинство конфликтных ситуаций возникает в ходе локализации проблем, когда по вине сотрудников компании-поставщика может пройти не один час до начала реальных действий по устранению неисправности.

Мониторинг качества услуг на базе IP требует определенного уровня автоматизации, что предполагает использование программно-аппаратных комплексов с функциями проактивного мониторинга (сбор, анализ и визуализация качественных показателей контролируемых услуг, регистрация и оперативное реагирование в случае ухудшения качества и аварийных событий).

Технически мониторинг качественных показателей услуг выполняется путем измерения параметров качества IP-соединений с использованием методов «подмешивания» тестового трафика в активные соединения, для чего могут использоваться как программные, так и аппаратные средства (зонды SLA). Таким образом, место установки зонда SLA в сеть и будет точкой демаркации.

Функционирование зондов SLA не должно оказывать ощутимого воздействия на параметры качества сервиса. Идеальным вариантом является применение аппаратных зондов SLA, устанавливаемых в разрыв соединения непосредственно перед маршрутизатором клиента (CE). Однако по ряду причин такие схемы включения применяются далеко не всегда — например, этому может препятствовать высокая стоимость зондов, устанавливаемых в разрыв соединения, либо принципиальное нежелание оператора или клиента устанавливать что-либо на канале. Поэтому нередки случаи, когда зонд SLA подключается к свободному порту CE-маршрутизатора или последующего коммутатора, то есть точка демаркации смещается в сторону локальной сети клиента или, наоборот, в сторону оператора связи.

Таким образом, можно сделать вывод, что универсального решения по выбору точки демаркации нет и в каждом конкретном случае нужно тщательно рассматривать различные варианты. Но договор SLA тем и хорош, что обеспечивает необходимую гибкость в формировании отношений и позволяет в случае любого смещения точки демаркации вносить соответствующие изменения (например, требование о проверке зонда SLA или установке его вместо CE для подтверждения отказа услуги).

ПРАВИЛЬНОЕ СОГЛАШЕНИЕ ВЫГОДНО ВСЕМ

В повседневной практике применения SLA на отечественном рынке инфокоммуникационных услуг периодически возникают вопросы о целесообразности соглашения SLA и выгодах, которые оно приносит. И хотя SLA является главным, если не единственным инструментом в сфере регулирования качества инфокоммуникационных услуг между юридическими лицами, отсутствие понимания обоюдных выгод от его использования мешает установлению здоровых отношений между поставщиком и оператором.

Для оператора SLA — это мощное оружие в непрерывно усиливающейся борьбе за позиции на рынке. Во-первых, SLA — это инструмент, позволяющий взглянуть на качество своих услуг глазами потребителей и транслировать его на внутренние бизнес-процессы. Понимание того, как клиент оценивает получаемые им услуги, является уникальным, сложно воспроизводимым фактором повышения конкурентоспособности, тогда как другие (ценовая политика, портфолио продуктов и услуг, маркетинг) могут копироваться.

Во-вторых, концепция демаркации, широко применяемая в SLA, позволяет однозначно разграничить зоны ответственности, повысить скорость локализации (оперативное выявление недостатков и причин их возникновения) и устранения проблемы, что тоже способствует повышению лояльности абонентов.

В-третьих, SLA может рассматриваться как услуга с добавленной стоимостью (Value Added Service, VAS), предоставление которой приносит прямой доход, то есть повышает ARPU. Услуги с мониторингом качества и гарантированным уровнем обслуживания по SLA могут быть на 10–15% дороже. Следует также отметить, что сама философия SLA предоставляет основу для более плотных взаимоотношений с клиентом (аутсорсинг, интеграция с ИТ и т. д.).

Для потребителя SLA — это инструмент, позволяющий добиться прозрачности при управлении качеством арендуемых инфокоммуникационных услуг.

Большинство бизнес-критичных сервисов напрямую зависят от того, насколько эффективно взаимодействуют удаленные ИТ-компоненты, и отказ одного канала связи может оказать катастрофическое воздействие на слаженную работу всех бизнес-процессов. Однако SLA позволяет снизить риски финансовых потерь, вызванных неработоспособностью арендованных услуг связи и ИТ, благодаря определению уровня компенсации за несоответствие качества обслуживания гарантированному.

Разграничение зон ответственности с оператором связи позволяет однозначно определить, где находится источник проблемы, и если он обнаруживается на стороне ИТ-клиента — приступить к устранению неполадки еще до получения ответа от службы технической поддержки.

Владимир Левин — генеральный директор Wellink, Денис Дякив — руководитель департамента разработки Wellink.