В Национальной хоккейной лиге проводят оцифровку и переработку собранных данных об играх и игроках, накопленных за столетнюю историю, чтобы предложить возможности анализа и визуализации данных, которые, как надеются в НХЛ, заинтересуют давних болельщиков и привлекут больше новых.
В НХЛ объявили о начале долгосрочного партнерства с компанией SAP, благодаря которому у любителей хоккея и журналистов появится возможность анализировать официальную статистику НХЛ по командам и игрокам. Так, в новой системе можно будет строить сложные наглядные репрезентации данных, сообщает Стив Макардл, исполнительный вице-президент НХЛ по цифровому контенту и стратегическому планированию.
«Болельщики со стажем начинают не хуже специалистов разбираться в тактике и стратегии, а учитывая рост современных вычислительных мощностей, почему бы не воспользоваться ими для анализа происходящего на льду», — отмечает он.
Хоккей вступает в цифровую эпоху
Хоккей всегда оставался в каком-то смысле спортом старой школы — многие клубы и тренеры не торопились брать на вооружение аналитику, подобно тому как это происходило в бейсболе, до тех пор пока «саберметрика» (использование статистики для полного и точного анализа игроков) буквально не «взорвала» этот вид спорта, резко увеличив его популярность. Считалось, что особенности хоккея, в том числе мгновенные перемены ситуации на площадке и ротация игроков на протяжении всей игры, затрудняют моделирование, в отличие от бейсбола с его размеренным темпом и выходами игроков один на один.
Но, как это произошло и с саберметрикой, небольшая группа заядлых хоккейных болельщиков самостоятельно взялась за анализ статистики и даже придумала свой собственный жаргон. Некоторые термины из него стали расхожими.
Corsi. Показатель, названный по имени тренера команды Buffalo Sabres Джима Корси, — сумма бросков по воротам с учетом промахов и заблокированных вратарем, то есть по сути общее количество попыток забить гол. Corsi может быть выражен в виде разности или доли для сопоставления числа бросков по воротам двух команд, чтобы можно было приблизительно оценить, в чьем распоряжении шайба находилась чаще. Corsi можно также применять для индивидуальной оценки, если считать число бросков, совершенных, пока тот или иной игрок находится на льду. Хотя обладание шайбой не гарантирует победы, команды, удерживающие шайбу дольше, имеют больше шансов на успех в долгосрочной перспективе. У большинства игроков и команд соотношение Corsi составляет 40–60%, а у самых лучших — от 55%.
Fenwick. Это разновидность Corsi, названная по фамилии блогера команды Calgary Flames Мэтта Фенвика. Данный показатель учитывает только число бросков и промахов без заблокированных вратарем. Fenwick обычно сильнее коррелирует с вероятностью забивания голов, но на больших отрезках времени разницы между Corsi и Fenwick практически нет.
PDO. Звучит как аббревиатура, но это не аббревиатура, а онлайн-никнейм человека, изначально предложившего данный показатель. PDO — это сумма процента реализованных бросков и процента отраженных, когда команды играют на поле в равном составе. Показатель можно использовать для индивидуальной оценки: для этого суммируют проценты реализованных и отраженных бросков, когда игра идет в равном составе и на площадке присутствует конкретный игрок, которого хотят оценить. PDO позволяет оценить «удачливость» команды в корреляции с результативностью. Как объясняют редакторы сайта NHL.com, с помощью PDO, к примеру, можно объяснить, почему Washington Capitals в прошедший сезон играли плохо, несмотря на присутствие в команде восходящей звезды, форварда Александра Овечкина. Последний забивал голы при 8,97% бросков по воротам, в то время как у команды в целом этот показатель, когда Овечкин был на льду, составил лишь 5,84%. По PDO в прошлом сезоне он занял лишь пятое с конца место среди хоккеистов, проведших в игре как минимум 1000 минут.
Зоны начала игры (zone starts). Используется в дополнение к Corsi для индивидуальной оценки игроков. Показатель отражает соотношение числа вбрасываний в зоне атаки и защиты, когда команды на площадке играют в равном составе. Предложен по той причине, что у игроков с высоким соотношением zone starts — то есть чаще начинающих игру в зоне атаки — Corsi будет автоматически выше, чем у игроков с низким zone starts, то есть начинающих в зоне защиты.
Есть и другие показатели. По словам Макардла, болельщики о них ожесточенно спорят в Интернете, но обычно это происходит не на сайте НХЛ, и новичкам подобный жаргон может показаться совершенно непонятным.
«По сути появилась «кустарная» аналитика по нашим играм, — продолжает он. — Но мы стремимся к тому, чтобы беседы о хоккее в НХЛ все-таки велись на NHL.com, и эта народная инициатива стала для нас своеобразным толчком, ведь у нас есть данные — официальная статистика по играм и система подсчета голов в реальном времени. Мы получаем информацию быстрее, чем кто-либо».
Аналитика становится официальной
«Наша задача номер один — разместить статистику на NHL.com, — подчеркивает Крис Фостер, директор по развитию цифрового бизнеса НХЛ, руководитель проекта по оцифровке всей информации по играм, начиная с самого первого сезона 1917–1918 годов. — Ведь интересующиеся в первую очередь заходят именно на наш сайт. Мы понимаем, что на освоение новшеств понадобится какое-то время, но готовы обучать наших болельщиков, чтобы они анализировали игры по-новому».
Для начала в НХЛ переименовали народные статистические показатели. Corsi теперь называется Shot Attempts (число бросков, SAT), Fenwick — Unblocked Shot Attempts (число незаблокированных бросков, USAT), а PDO — Shooting Percentage Plus Save Percentage (процент бросков плюс процент отраженных бросков, SPSV%).
«На сайте будут подробные разъяснения по поводу смысла показателей и принципов их интепретации, — сообщил Макардл. — Чтобы развеять таинственность, мы изменили названия и надеемся, что теперь они будут понятны даже случайному посетителю».
В рамках первого этапа переработки раздела статистики на сайте NHL.com было добавлено еще около трех десятков показателей, в том числе количество пасов, голов и штрафов в единицу времени, средняя дистанция броска и др.
Второй этап модернизации планируется закончить ко времени плей-офф Кубка Стэнли. На сайте появится инструмент анализа всех игр на основе алгоритма, учитывающего 37 различных переменных. Средства фильтрации позволят посредством интерактивных графиков сравнивать игроков и команды по играм, сезонам и общей карьере.
На третьем этапе, планируемом на начало сезона 2015/2016 года, будут добавлены новые показатели, визуализации, а также инструменты сравнения и прогнозирования результативности игроков, предсезонные рейтинги и т. п.
В 2016 году будет проведен четвертый этап, приуроченный к столетию НХЛ. На сайте появится полная официальная статистика за всю историю лиги, включая каждый гол с самого первого сезона. Кроме того, будут добавлены новые фильтры, визуализации и другие средства работы с исторической статистикой.
«Исторические данные, конечно, не такие подробные, как собираемые сегодня, но их важность трудно переоценить, — отмечает Макардл. — Вы впервые сможете не просто поспорить в баре о том, кто лучший хоккеист за всю историю — Горди Хоу, Уэйн Гретцки или Сидни Кросби, — но и подкрепить свои доводы наглядными визуализациями. Вы сможете сравнивать команды, выясняя, кто был лучшим в тот или иной период. Нашими данными смогут пользоваться болельщики, репортеры, блогеры, аналитики и спортивные комментаторы».
В основе системы будут сервис SAP HANA Enteprise Cloud и другие решения и технологии SAP.
- Thor Olavsrud. NHL seeks to gr ab fans with data analytics. CIO. Mar 25, 2015