Детальная информация

Название: Лингвистические параметры для идентификации скрытых сетевых сообществ // Terra Linguistica. – 2024. – С. 102-115
Авторы: Мамаев И. Д.; Митрофанова О. А.
Выходные сведения: 2024
Коллекция: Общая коллекция
Тематика: Языкознание; Математическая лингвистика; Прикладное языкознание; лингвистические параметры; сетевые сообщества; скрытые сетевые сообщества; идентификация сетевых сообществ; лингвистическая диагностика; корпусная лингвистика; математические методы; linguistic parameters; network communities; hidden network communities; identification of network communities; linguistic diagnostics; corpus linguistics; mathematical methods
УДК: 81'32; 81'33
ББК: 81.1
Тип документа: Статья, доклад
Тип файла: PDF
Язык: Русский
DOI: 10.18721/JHSS.15108
Права доступа: Свободный доступ из сети Интернет (чтение, печать, копирование)
Дополнительно: Новинка
Ключ записи: RU\SPSTU\edoc\72968

Разрешенные действия: Прочитать Загрузить (0,9 Мб)

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Современные процедуры лингвистической диагностики нуждаются в усовершенствовании применительно к изучению текстов социальных сетей. Одна из проблем, требующих решения, - это выявление лингвистических признаков текстов, значимых для профилирования пользователей - участников скрытых сообществ. Целью данного исследования является разработка гибридного алгоритма обнаружения скрытых сетевых сообществ, учитывающего интересы пользователей, тематику их постов и опирающегося на контекстуализированные языковые модели. Выбор данного подхода обусловлен тем, что алгоритмы выделения скрытых сообществ, основанные на математических методах, используют формальные показатели без учета лингвистических параметров текстов. Это может привести к искажению реального количества и свойств скрытых сообществ. Материалом исследования является корпус русскоязычных постов социальной сети ВКонтакте объемом более 10000 текстов. В результате эксперимента по применению гибридного алгоритма, предложенного авторами статьи, было выделено 34 скрытых сообщества. Авторская методика выявления и профилирования скрытых сообществ представляет интерес для специалистов в области медиаисследований, которые изучают архитектуру социальных сетей. Методику можно внедрить в существующие системы автоматической модерации групп и системы прогнозирования сетевых тенденций.

Scholars need to improve modern linguistic diagnostic procedures when studying social network texts. One of the unresolved problems is the identification of linguistic features since they are significant for profiling members of hidden communities. The aim of this research is to develop a hybrid algorithm for detecting hidden network communities that takes into account the interests of users, the topics of their posts and is based on contextualized language models. The choice of this approach is due to the fact that algorithms for detecting hidden communities with the help of mathematical methods use formal parameters, but not linguistic ones. This may change the actual number of communities and their properties. The research material is a corpus of VK posts in Russian, which includes more than 10,000 texts. The authors applied the hybrid algorithm and detected 34 hidden communities in the course of the experiment. The current methodology for identifying and profiling hidden communities is of interest to media researchers who study the architecture of social networks. The approach can be implemented into existing automatic group moderation systems and network trend forecasting systems.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования

stat Количество обращений: 49
За последние 30 дней: 32
Подробная статистика