08:20 20.03.2017 |   2714



Система «Талисман» выявляет фиктивные аккаунты, служащие для распространения недостоверной информации, спама и имитации массовой активности. «Текстерра» — технология многоязычного интеллектуального анализа текста.

Институт системного программирования РАН представил две свои разработки, предназначенные для анализа больших массивов данных социальных сетей.

«Текстерра» — технология многоязычного интеллектуального анализа текста. В ее основе — программный комплекс, способный накапливать и анализировать информацию, устанавливать взаимосвязь между понятиями и проводить интеллектуальный анализ текстов. В результате при использовании этой технологии возможно вычислять лексически сходные тексты, принадлежащие перу одного автора или написанные по единому плану, содержащие сходные семантические конструкции, выявлять факт и структуру информационных «вбросов».

Система «Талисман» позволяет отследить и выявить фиктивные аккаунты, служащие для распространения недостоверной информации, спама, имитации массовой активности — ботов. Анализ производится по полным и неполным данным, указанным в профилях социальных сетей, социальным связям аккаунтов, подпискам, спискам друзей и читателей. В результате анализа определяются такие демографические атрибуты, как возраст пользователя, а также семейное положение, уровень образования и так далее. Если значения тех или иных атрибутов не вписываются в создаваемый программным комплексом алгоритм, можно с серьезной долей уверенности говорить о том, что выпадающий из схемы профиль социальной сети принадлежит не живому человеку, а создан искусственно.

Также технология «Талисман» позволяет на основании анализа неполных данных с использованием информации из социальных сетей вычислить примерное место проживания пользователя, его принадлежность к определенному социальному слою, приверженность той или иной идеологии и другую полезную информацию.

По словам Арутюна Аветисяна, директора ИСП РАН, анализ информации в соцсетях сегодня — насущная необходимость; это и маркетинговый инструмент, позволяющий оценивать аудиторию, выявлять закономерности, помогающие работать адресно с разными возрастными и социальными группами; одновременно это инструмент безопасности.

В ИСП РАН продолжают совершенствование обоих программных комплексов, наращивается их функционал и мощность.


Теги: Социальные сети Большие данные
На ту же тему: