Исследователи из Рочестерского университета создали на базе технологий машинного обучения систему, способную не только находить записи в Twitter по ключевым словам, имеющим отношение к алкоголю, но и определять, действительно ли пользователь в момент отправки записи употреблял спиртное, и, если да, то где он этим занимался — у себя дома, в баре или где-то еще.
Исследователи собрали базу сообщений с геометками, отправленных за год пользователями из Нью-Йорка и его окрестностей. Затем они отобрали сообщения с ключевыми словами, относящимися к спиртному, и отправили их на анализ работникам краудсорсинговой системы Mechanical Turk. Те должны были определить, действительно ли в сообщении говорится о потреблении алкоголя и, что более важно, пил ли сам автор сообщения. Аналогично исследователи поступили с информацией о местонахождении авторов сообщений. Полученные сведения были использованы для обучения алгоритма.
Ученые рассчитывают применить новую систему для анализа связи потребления алкоголя с географией и другими факторами, а также его влияния на здоровье жителей.