Details

Title: Классификация учетных записей пользователей социальной сети Twitter на основе анализа их поведения с применением методов машинного обучения: выпускная квалификационная работа специалиста: 10.05.04 - Информационно-аналитические системы безопасности ; 10.05.04_01 - Автоматизация информационно-аналитической деятельности
Creators: Туманян Полина Игоревна
Scientific adviser: Резединова Евгения Юрьевна
Other creators: Резединова Евгения Юрьевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2019
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: информационная безопасность; социальные сети; анализ данных; машинное обучение; random forest; information security; social networks; Twitter; data analysis; machine learning
Document type: Specialist graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 10.05.04
Speciality group (FGOS): 100000 - Информационная безопасность
Links: http://doi.org/10.18720/SPBPU/3/2019/vr/vr19-95; http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-95-o.pdf; http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-95-r.pdf; http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-95-a.pdf
Rights: Свободный доступ из сети Интернет (чтение, печать, копирование)

Allowed Actions: Read Download (2.6 Mb) You need Flash Player to read document

Group: Anonymous

Network: Internet

Annotation

В работе предлагается классификация учетных записей пользователей в социальной сети Twitter на основе анализа их поведения. В качестве классификаторов применяются RandomForest, Naive Bayes и другие. Исследованы поведенческие стратегии реальных людей и ботов. Разработана программная реализация системы сбора и обработки данных об учетных записях с применением Twitter API и библиотек языка Python. Применяется метод «мешка слов» для улучшения классификации. Проведена оценка эффективности и качества полученной классификации.

The paper proposes a classification of user accounts in the social network Twitter based on an analysis of their behavior. RandomForest, Naive Bayes and others are used as classifiers. Behavioral strategies of real people, as well as bots, are investigated. A software implementation of a system for collecting and processing account data using the Twitter API and Python libraries has been developed. The “bag of words” method is used to improve the classification. An assessment of the effectiveness and quality of the resulting classification.

Document access rights

Network User group Action
FL SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Document usage statistics

stat Document access count: 159
Last 30 days: 11
Detailed usage statistics