Таблица | Карточка | RUSMARC | |
Разрешенные действия: Прочитать Загрузить (0,9 Мб) Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
Современные процедуры лингвистической диагностики нуждаются в усовершенствовании применительно к изучению текстов социальных сетей. Одна из проблем, требующих решения, - это выявление лингвистических признаков текстов, значимых для профилирования пользователей - участников скрытых сообществ. Целью данного исследования является разработка гибридного алгоритма обнаружения скрытых сетевых сообществ, учитывающего интересы пользователей, тематику их постов и опирающегося на контекстуализированные языковые модели. Выбор данного подхода обусловлен тем, что алгоритмы выделения скрытых сообществ, основанные на математических методах, используют формальные показатели без учета лингвистических параметров текстов. Это может привести к искажению реального количества и свойств скрытых сообществ. Материалом исследования является корпус русскоязычных постов социальной сети ВКонтакте объемом более 10000 текстов. В результате эксперимента по применению гибридного алгоритма, предложенного авторами статьи, было выделено 34 скрытых сообщества. Авторская методика выявления и профилирования скрытых сообществ представляет интерес для специалистов в области медиаисследований, которые изучают архитектуру социальных сетей. Методику можно внедрить в существующие системы автоматической модерации групп и системы прогнозирования сетевых тенденций.
Scholars need to improve modern linguistic diagnostic procedures when studying social network texts. One of the unresolved problems is the identification of linguistic features since they are significant for profiling members of hidden communities. The aim of this research is to develop a hybrid algorithm for detecting hidden network communities that takes into account the interests of users, the topics of their posts and is based on contextualized language models. The choice of this approach is due to the fact that algorithms for detecting hidden communities with the help of mathematical methods use formal parameters, but not linguistic ones. This may change the actual number of communities and their properties. The research material is a corpus of VK posts in Russian, which includes more than 10,000 texts. The authors applied the hybrid algorithm and detected 34 hidden communities in the course of the experiment. The current methodology for identifying and profiling hidden communities is of interest to media researchers who study the architecture of social networks. The approach can be implemented into existing automatic group moderation systems and network trend forecasting systems.
Права на использование объекта хранения
Входит в состав
Статистика использования
|
Количество обращений: 49
За последние 30 дней: 32 Подробная статистика |