Система машинного обучения, разработанная в Лос-Аламосской национальной лаборатории, обнаруживает в социальных сетях конспирологические теории, касающиеся COVID-19, и строит модель их эволюции в зависимости от времени. Как объясняют разработчики, создавая систему, они рассчитывали, что она поможет уточнить особенности изменения дезинформации по мере распространения. В дальнейшем похожая программа может помочь властям обнаруживать теории заговора, которые активно распространяются через соцсети, и планировать соответствующие кампании по информированию о реальных фактах для предотвращения укоренения неверных представлений.
Для разработки системы использовалась база анонимизированных сообщений Twitter за первые пять месяцев пандемии, посвященных основным теориям заговора о COVID-19. Конкретно, в рамках исследования изучалась эволюция слухов о том, что вирус распространяется вышками 5G; что Фонд Билла и Мелинды Гейтс причастен к разработке COVID-19 либо использует вирус в злонамеренных целях; что вирус создан искусственно и что разрабатываемые вакцины против COVID-19 будут представлять опасность.
Всего было собрано около 1,8 млн твитов с ключевыми словами, касающимися заболевания, и с помощью фильтрации образцов в этом объеме данных были выделены подмножества, посвященные упомянутым теориям заговора. Несколько сотен твитов из этих подмножеств затем разметили вручную — так была сформирована обучающая выборка. После этого была построена модель на основе алгоритма Random Forest, которая классифицировала твиты в качестве дезинформации о COVID-10 или наоборот.
Исследование показало, что дезинформирующие твиты чаще имели негативную тональность, чем достоверные, и что конспирологические теории со временем меняются, вбирая в себя подробности из других слухов и реальных событий.
К примеру, в марте 2020 года Билл Гейтс в интерактивном режиме отвечал на вопросы подписчиков на форуме Reddit Ask Me Anything, и в частности упомянул финансируемую его фондом разработку невидимого красителя, который можно было бы вводить вместе с вакциной для регистрации факта вакцинации. Невооруженным глазом такой краситель увидеть нельзя, но отметка была бы видна в специальном приложении при освещении инфракрасными лучами с помощью смартфона. Система показала, что сразу после онлайн-конференции начала расти частота сообщений с упоминанием «чипирования с помощью вакцины для контроля населения».
Источник: Los Alamos National Laboratory
Авторы также показали, что метод обучения с учителем позволяет автоматически обнаруживать теории заговора в социальных сетях, а с помощью динамических тематических моделей можно исследовать изменение веса различных ключевых слов в рамках конкретных ложных теорий.