Лингвистические параметры для идентификации скрытых сетевых сообществ

Мамаев, И. Д.; Митрофанова, О. А.

Details

	Table	Card	RUSMARC

Title:	Лингвистические параметры для идентификации скрытых сетевых сообществ // Terra Linguistica. – 2024. – С. 102-115
Creators:	Мамаев И. Д.; Митрофанова О. А.
Imprint:	2024
Collection:	Общая коллекция
Subjects:	Языкознание; Математическая лингвистика; Прикладное языкознание; лингвистические параметры; сетевые сообщества; скрытые сетевые сообщества; идентификация сетевых сообществ; лингвистическая диагностика; корпусная лингвистика; математические методы; linguistic parameters; network communities; hidden network communities; identification of network communities; linguistic diagnostics; corpus linguistics; mathematical methods
UDC:	81'32; 81'33
LBC:	81.1
Document type:	Article, report
File type:	PDF
Language:	Russian
DOI:	10.18721/JHSS.15108
Rights:	Свободный доступ из сети Интернет (чтение, печать, копирование)
Additionally:	New arrival
Record key:	RU\SPSTU\edoc\72968

Allowed Actions: Read Download (0.9 Mb)

Group: Anonymous

Network: Internet

Annotation

Современные процедуры лингвистической диагностики нуждаются в усовершенствовании применительно к изучению текстов социальных сетей. Одна из проблем, требующих решения, - это выявление лингвистических признаков текстов, значимых для профилирования пользователей - участников скрытых сообществ. Целью данного исследования является разработка гибридного алгоритма обнаружения скрытых сетевых сообществ, учитывающего интересы пользователей, тематику их постов и опирающегося на контекстуализированные языковые модели. Выбор данного подхода обусловлен тем, что алгоритмы выделения скрытых сообществ, основанные на математических методах, используют формальные показатели без учета лингвистических параметров текстов. Это может привести к искажению реального количества и свойств скрытых сообществ. Материалом исследования является корпус русскоязычных постов социальной сети ВКонтакте объемом более 10000 текстов. В результате эксперимента по применению гибридного алгоритма, предложенного авторами статьи, было выделено 34 скрытых сообщества. Авторская методика выявления и профилирования скрытых сообществ представляет интерес для специалистов в области медиаисследований, которые изучают архитектуру социальных сетей. Методику можно внедрить в существующие системы автоматической модерации групп и системы прогнозирования сетевых тенденций.

Scholars need to improve modern linguistic diagnostic procedures when studying social network texts. One of the unresolved problems is the identification of linguistic features since they are significant for profiling members of hidden communities. The aim of this research is to develop a hybrid algorithm for detecting hidden network communities that takes into account the interests of users, the topics of their posts and is based on contextualized language models. The choice of this approach is due to the fact that algorithms for detecting hidden communities with the help of mathematical methods use formal parameters, but not linguistic ones. This may change the actual number of communities and their properties. The research material is a corpus of VK posts in Russian, which includes more than 10,000 texts. The authors applied the hybrid algorithm and detected 34 hidden communities in the course of the experiment. The current methodology for identifying and profiling hidden communities is of interest to media researchers who study the architecture of social networks. The approach can be implemented into existing automatic group moderation systems and network trend forecasting systems.

Document access rights

	Network		User group		Action
	ILC SPbPU Local Network		All
	Internet		All

Included in

Terra Linguistica. — Санкт-Петербург: СПбПУ, 2022-. — Электрон. журнал. — Периодичность: 4 раза в год. — Свободный доступ из сети Интернет (чтение, печать, копирование).

Terra Linguistica. — Санкт-Петербург: СПбПУ, 2022-. Т. 15, № 1, 2024. — 1 файл (3,5 Мб). — Свободный доступ из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/j24-158.pdf>.

Usage statistics

Access count: 49
Last 30 days: 32
Detailed usage statistics