На основе больших данных создаются инструменты, позволяющие талантливым ребятам поближе познакомиться с хорошими региональными вузами, узнать об имеющихся возможностях и образовательных траекториях

Битва за таланты: цифровой след абитуриента
05.10.2020

Вопрос поступления в вуз рано или поздно касается почти каждой российской семьи. Как сделать правильный выбор и чем университеты могут помочь своим потенциальным абитуриентам? Цифровой след, проанализированный с использованием методов больших данных, расскажет об интересах школьников и поможет в их профориентации, а в дальнейшем — в получении более качественного образования. Еще одно перспективное использование цифрового следа для работодателей — забота о благополучии и здоровье сотрудников.

Главная проблема нынешних абитуриентов заключается в том, что у большинства ребят отсутствует понимание того, каким образом может сложиться их карьерный путь в том или ином вузе и что может помочь им в развитии. Многие ориентируются лишь на рейтинг вуза и свой балл ЕГЭ.

Балл этот во многом определяет список университетов, в которые абитуриент может поступить. И стремление талантливых ребят из провинции поступить в один из столичных вузов вполне предсказуемо. Однако такой переезд сопровождается рядом бытовых сложностей, не все к этому готовы, да и не всегда переезд благотворно сказывается на молодых людях. Более того, далеко не всегда они правильно выбирают вуз с точки зрения профориентации. И увы — не прекращается массовый отток одаренных ребят из регионов в центр, и обратно они зачастую уже не возвращаются. Это одна из серьезных проблем государственного уровня — истощение кадрового потенциала даже в крупных и достаточно успешных городах.

В Университетском консорциуме исследователей больших данных ищут решение проблемы оттока молодежи из регионов с помощью целенаправленной работы с наиболее талантливыми школьниками. Потенциальных абитуриентов региональные вузы идентифицируют через социальные сети, блоги и другие веб-ресурсы. Цифровой след в сети «ВКонтакте» вполне информативным и служит ценным источником данных. Информация о том, на что подписаны школьники, чем интересуются, что лайкают и репостят, кто их друзья, помогает определить их потенциальные интересы, активность и таланты в различных областях. Наиболее перспективных приглашают в образовательные сообщества, где в числе прочих сведений обеспечивают информацией о возможностях обучения в ведущих местных университетах.

Консорциум был основан по инициативе Томского государственного университета, и впоследствии в него вошли более 20 вузов. Ни один университет в одиночку такую задачу решить не смог бы: требуется инфраструктура, нужны люди, умеющие работать с большими данными, а также эксперты в психологии и социологии. ТГУ предоставил инфраструктуру, а специалисты из других вузов вносят свой вклад, анализируя данные и разрабатывая собственные методологии. Это ситуация, когда «один плюс один» оказывается гораздо больше, чем «два».

Оставить таланты дома

Михаил Мягков

Михаил Мягков: «Как и в любой задаче анализа больших данных с использованием машинного обучения, чем больше мы узнаем про абитуриентов, тем лучше становится методология и точнее создаваемая модель». Фото: Севастопольский государственный университет

Михаил Мягков, председатель Университетского консорциума исследователей больших данных, рассказывает о методах, используемых для работы с потенциальными абитуриентами, достигнутых результатах и перспективах использования цифрового следа в будущем.

- Надо ли бояться своего цифрового следа? Ведь эти данные могут использоваться всеми, и еще неизвестно в каких целях… Мы все ближе к созданию всеобъемлющего социального скоринга.

За своими действиями всегда надо следить, и это относится не только к цифровому следу. Ваша жизнь теперь видна несколько большему числу людей, чем это было раньше. Когда я учился в институте, мои «косяки» видели пять–десять человек, а через пару недель про это забывали. Сейчас же любую серьезную оплошность могут увидеть миллионы, и, скорее всего, цифровой мир ее уже не забудет.

Цифрового следа бояться не надо. Надо понимать, что личное пространство — то, что называется словом privacy, — во многом размывается с появлением больших данных и цифровизации общества. Революция, произошедшая с появлением смартфонов, привела не только к полному изменению способов коммуникации, но и к тому, что наша жизнь стала видна очень большому числу людей. Это данность, с которой нужно научиться жить.

- Как родилась идея поиска абитуриентов в соцсетях?

Одна из основных проблем — если вообще не главная — российских регионов заключается в том, что огромное количество талантливых ребят уезжают учиться в Москву и назад уже никогда не возвращаются. Это классическая модель трудовой миграции, при которой центр притягивает к себе самое лучшее, а регионам остаются кадры попроще. Но ведь там тоже нужны хорошие управленцы, врачи, ученые и т. п.

Проблема возникла не на пустом месте, это следствие ЕГЭ. У ЕГЭ есть много положительных характеристик, но один из серьезных побочных эффектов заключается в том, что выпускникам стало гораздо легче попасть в московские вузы. Видя у себя подходящую сумму баллов, молодой человек «пакует чемоданы». У этих ребят есть хорошие возможности для развития у себя дома, но они предпочитают средненький столичный институт.

Мы придумали несколько инструментов, позволяющих талантливым ребятам лучше оценить достоинства хороших региональных вузов. Поближе познакомиться с ними, узнать о возможностях и образовательных траекториях, которые там есть.

Для поиска талантливых абитуриентов очень удобно использовать их цифровой след, и в первую очередь — активность в соцсетях (участие в сообществах, посты и репосты, лайки). Такой след неплохо характеризует выпускника.

- Как выглядит «охота» на абитуриента его глазами?

Все-таки про охоту говорить некорректно, потому что мы не занимаемся прямым маркетингом условного ТГУ. Когда мы идентифицируем целевые группы абитуриентов по их цифровому следу, мы примерно понимаем их интересы. Для начала мы создаем для них сообщества, на сайтах которых размещаем потенциально интересную образовательную и профессиональную информацию. Мы приглашаем ребят присоединиться к этим сообществам, и это никак не связано с рекламой университета. Лишь затем их начинают подводить к мысли о поступлении — показывать образовательные траектории, преподавательский состав. Но это не призывы типа «Посмотрите, как в ТГУ все хорошо», а полезная информация: «Посмотрите, какие были проведены исследования по интересующей вас теме. А вот этот профессор преподает в ТГУ соответствующие курсы». Мы очень аккуратно подводим молодых людей к тому, что их интересы и навыки вполне можно развивать недалеко от дома, а не только в столице.

- Важно ли, чтобы действия происходили «как бы сами собой»? Или школьнику неплохо знать об интересе к нему со стороны какого-то конкретного вуза?

Вряд ли это отпугнет абитуриентов, ведь мы не действуем нахрапом. Кстати, я не могу сказать, что хотя бы 50% идентифицированных ребят в итоге интересуются поступлением в хороший региональный вуз. Для меня абсолютный успех нашей кампании ограничивается показателем 10–15%.

Выделяя лучших

- Что имеет значение в цифровом следе абитуриента при построении его профиля? Это только участие в группах и лайки или нечто более глубокое?

Как и в любой задаче анализа больших данных с использованием машинного обучения, чем больше мы узнаем про абитуриентов (кто куда поступил, где мы в итоге промахнулись, а где были правы), тем лучше становится наша методология и точнее создаваемая модель. Мы начали исключительно с участия в сообществах, и это на самом деле один из лучших критериев, если требуется определить, какими темами интересуется школьник. Для этого потребовалось разметить около миллиона сообществ, созданных на территории России, сопоставить их с определенными тегами. Но как только мы перешли от теории к практике и стали работать с живыми людьми, то увидели, что существует много других факторов: лайки, репосты, активность человека и его вовлеченность в использование ресурсов, связанных с образовательной средой.

- А какие цифровые следы могут оттолкнуть вуз от попытки привлечь школьника к себе?

Пока мы такими историями не занимаемся. Лишь ищем ребят, выделяющихся среди остальных своим повышенным интересом и активностью в сегменте образовательных ресурсов. Мы не пытаемся сегментировать всех школьников на «хороших» и «плохих». Да я и не считаю, что такая задача может возникнуть. Неважно, чем занимается человек в соцсетях. Это его личное дело, никакого негатива мы не ищем. Нам важнее из огромной массы школьников выбрать тех, с кем мы хотели бы поработать.

- Чего в ваших моделях больше — математики или психологии и прочих нематематических дисциплин?

Конечно, если смотреть на модели машинного обучения, оценивающие поведение людей и на основе этого делающие выводы, то, с моей точки зрения, сейчас в них больше математики. Хотя бы потому, что это проще: вы собираете данные, загружаете их в нейросеть, используете машинное обучение — и получаете нечто «красивое» на выходе. Однако часто такие модели работают не слишком эффективно, потому что человек, как известно, существо очень многогранное. Для его описания необходимо много переменных — миллионы, если не миллиарды. Поэтому, помимо применения формальных статистических методов, необходимо вовлекать психологов, использовать методы психологического тестирования, сегментирования и т. п.

Недавно мы выиграли грант Российского научного фонда, в рамках работ по которому сопоставляем цифровой след человека с результатами психологического тестирования и на основании этого делаем выводы. Основная идея этого проекта — оценить, как меняется психологическое состояние и цифровой след во время пандемии, но возможно и более широкое использование результатов, в том числе в отношении студентов.

Наверное, многие слышали о Cambridge Analytica — компании, которая стала главным творцом победы Трампа на выборах. В ней занимались именно этим: помимо простых статистических методов определения того, какой подход нужен к избирателю, применили психологическое сегментирование по критерию реакции людей на различные виды политических событий. Они разделили всех избирателей по их цифровому следу примерно на 60 психотипов и успешно это использовали. Мы идем примерно по тому же методологическому пути.

Реальные эффекты цифровых усилий

- Что ожидалось в качестве результата и что удалось получить в реальности?

Усилия вполне окупились. Мы увеличили средний балл ЕГЭ для абитуриентов на 5 пунктов, для регионального вуза это очень много. Мы действительно смогли оставить у себя достаточно большое число ребят, которые поступали бы в столичные вузы, — это тоже очень хороший результат. Помимо того, что совершенствуются наши механизмы работы с абитуриентами, оставшиеся дома таланты станут хорошим примером для будущих абитуриентов. Наконец, число отчислений в первый год обучения снизилось на 50%, а количество троечников — на 36%.

Здесь было бы неплохо пойти по американскому пути и создать систему, которую используют вузы второго эшелона, — «университет внутри университета» для наиболее одаренных студентов. Там все на более высоком уровне — и более сложный курс, и более крутые преподаватели.

- Создание каких сервисов возможно и какова их польза?

Сейчас мы собираем большую базу данных по абитуриентам, студентам и выпускникам. Естественно, мы видим ситуацию в динамике, и со временем у нас возникнет возможность анализировать изменения не только цифрового следа, но и настроения, психологии, компетенций, интересов людей, проходящих через систему высшего образования. Как известно, в России больше 80% выпускников школ поступают в какой-либо вуз. Это даст возможность понять, каким образом университет трансформирует личность. Хочу подчеркнуть, что пока мы только собираем данные для этой задачи, а конкретные инструменты неизбежно возникнут в будущем. Когда появился первый смартфон и возникла первая социальная сеть, мало кто мог предположить, что вскоре все кому не лень будут анализировать цифровой след человека, однако уже тогда этот след записывался. То же самое делаем мы сегодня, понимая, что это очень ценная информация.

Кроме того, сейчас в рамках консорциума мы развиваем большой проект совместно с HeadHunter, в котором определяем интересы, таланты и склонности студентов. Организуем различные практики и стажировки, по сути, сводя их с потенциальными работодателями, создаем пул талантов университетской среды России.

- Какими еще проблемами занимается Университетский консорциум исследователей больших данных?

Консорциум объединяет более 20 университетов, в которых созданы лаборатории анализа больших данных. Мы «всем миром» пытаемся решить общие проблемы университетов, которые частично могут быть решены с помощью больших данных.

Это созданная по инициативе нескольких университетов структура, к которой впоследствии присоединились очень многие, — облако данных и знаний. В каждом университете возникли группы с соответствующими компетенциями, которые совместно работают над реальными проектами, имеющими общественную и социальную значимость. Например, как только началась пандемия, у Министерства образования и науки возникли вопросы, как реагируют на эту ситуацию студенты, что происходит в их среде. Без существования нашего консорциума решить эту задачу было бы практически невозможно. Мы оперативно собрали и проанализировали более 2 млн аккаунтов студентов и 1 млн аккаунтов старшеклассников и получили очень интересные результаты. Это удалось сделать именно потому, что университеты уже работали вместе и у них были необходимые компетенции.

Консорциум — хороший пример того, как надо развивать сотрудничество в образовательной сфере в тех областях, где возникает такая потребность. Университетам выгоднее работать вместе, а не конкурировать друг с другом.

- Какую роль в будущем будет играть цифровой след человека?

Не секрет, что уже сейчас многие компании, принимая на работу нового сотрудника, собирают его цифровой след на протяжении нескольких последних лет. Этим занимаются как HR, так и службы безопасности. Таким образом, цифровой след уже начинает играть большую роль при трудоустройстве. Во многих компаниях он отслеживается и в процессе работы: за неэтичные высказывания и некорректные посты сотрудника вполне могут уволить, даже если они не имеют отношения к его трудовой деятельности. Цифровой след — данность, и он никуда не уйдет, именно поэтому с ним надо обращаться очень осторожно.

Куда ведут цифровые следы?

Долгие годы университеты ориентировались на рекрутинговую стратегию, основанную на рекламе своего «продукта» — образовательных программ. Однако в ходе экспериментов, проводимых Консорциумом, удалось понять, что новые маркетинговые подходы, выстроенные вокруг потребителя, то есть абитуриента, в образовательной среде работают еще лучше, чем в коммерческих компаниях.

Анализ цифрового следа

Анализ цифрового следа позволяет узнать об интересах абитуриентов, их склонностях и талантах, а в более ее широкой постановке задачи — способствовать получению ими более качественного образования, позаботиться об их благополучии и здоровье

На основе цифрового следа удается определить ту целевую группу, на которую каждому университету имеет смысл обращать внимание, и предлагать университетам различные программы по повышению эффективности приема. В результате становится возможным долгосрочное сотрудничество с университетами, построенное не только на выявлении абитуриентов и повышении эффективности их привлечения, но и на работе с университетскими офисами для развития долгосрочных стратегий по приему в университеты.

В ходе анализа удается узнать об интересах российских абитуриентов, их склонностях и талантах. Одна из задач российской университетской среды — создавать возможности для развития этих талантов, а не пытаться максимизировать число программ по наиболее актуальным сейчас направлениям. Совмещение талантов ребят с возможностями вузов — очень важная задача.

В дальнейшем проект планируется расширить: будут формироваться цифровые следы выпускников. С одной стороны, это станет катализатором развития фондов целевого капитала университетов, а с другой — поможет в трудоустройстве молодых специалистов.

Больше информации об интересных событиях, тенденциях и фактах в сфере цифровой экономики, мнений экспертов, а главное — ярких рассказов о решениях на основе данных в социальной сфере, здравоохранении, культуре, образовании, благотворительной и волонтерской деятельности, читайте в новом проекте «DobroData. Данные на службе добра». Пусть тех, кто умеет делать мир лучше, станет больше! Возрастная маркировка: 12+