Реакцию пользователей Twitter на предвыборные дебаты проанализируют при помощи Больших Данных




11:31 27.09.2016 |   2872



Сервис микроблогов предоставил исследователям из МТИ полный доступ к потоку сообщений. В обычные дни в Twitter публикуется порядка 500 млн сообщений, а в день президентских дебатов количество их должно резко возрасти.

Около года назад в лаборатории социальных машин Массачусетского технологического института был начат проект под названием Electome, посвященный исследованию общественного мнения с помощью методов машинного обучения. Представители комиссии по президентским дебатам обратились к руководителям проекта Electome с предложением проанализировать мнения пользователей Twitter о дебатах между Хиллари Клинтон и Дональдом Трампом.

Twitter предоставила исследователям полный доступ к потоку сообщений. В обычные дни в Twitter публикуется порядка 500 млн сообщений, а в день президентских дебатов количество их должно резко возрасти. Но в базе проекта Electome хранится еще больше сообщений — все, что появилось в Twitter со времени начала проекта. Анализ такого объема данных возможен только с помощью машинного обучения, считают исследователи. Чрезвычайно сложно установить даже тему отдельных сообщений, ведь в Twitter часто используются сокращения (как общепринятые, так и характерные для отдельных пользователей), а связь сообщения с выборами зависит от контекста — например, сообщения со словом «пневмония» до недавнего времени не имели отношения к выборам, а затем неожиданно приобрели большое значение. Поэтому в система учитывает и текущие события, обрабатывая по 500-600 новостей ежедневно.


Теги: Государство, общество и ИТ Самое интересное X (Twitter) МТИ Машинное обучение
На ту же тему: