Детальная информация

Туманян, Полина Игоревна. Классификация учетных записей пользователей социальной сети Twitter на основе анализа их поведения с применением методов машинного обучения [Электронный ресурс] = Classification of accounts of users of social Twitter network on the basis of analysis of their behavior with the application of machine training methods: выпускная квалификационная работа специалиста: 10.05.04 - Информационно-аналитические системы безопасности ; 10.05.04_01 - Автоматизация информационно-аналитической деятельности / П. И. Туманян; Санкт-Петербургский политехнический университет Петра Великого, Институт прикладной математики и механики ; науч. рук. Е. Ю. Резединова ; консультант по нормоконтролю Е. Ю. Резединова. — Электрон. текстовые дан. (1 файл : 2,6 Мб). — Санкт-Петербург, 2019. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/vr19-95.pdf>. — <URL:http://doi.org/10.18720/SPBPU/3/2019/vr/vr19-95>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-95-o.pdf>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-95-r.pdf>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-95-a.pdf>.

Дата создания записи: 28.02.2019

Тематика: информационная безопасность; социальные сети; анализ данных; машинное обучение; random forest; information security; social networks; Twitter; data analysis; machine learning; random forest

Коллекции: Выпускные квалификационные работы; Общая коллекция

Ссылки: DOI; Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований

Разрешенные действия: Прочитать Загрузить (2,6 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В работе предлагается классификация учетных записей пользователей в социальной сети Twitter на основе анализа их поведения. В качестве классификаторов применяются RandomForest, Naive Bayes и другие. Исследованы поведенческие стратегии реальных людей и ботов. Разработана программная реализация системы сбора и обработки данных об учетных записях с применением Twitter API и библиотек языка Python. Применяется метод «мешка слов» для улучшения классификации. Проведена оценка эффективности и качества полученной классификации.

The paper proposes a classification of user accounts in the social network Twitter based on an analysis of their behavior. RandomForest, Naive Bayes and others are used as classifiers. Behavioral strategies of real people, as well as bots, are investigated. A software implementation of a system for collecting and processing account data using the Twitter API and Python libraries has been developed. The “bag of words” method is used to improve the classification. An assessment of the effectiveness and quality of the resulting classification.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 131
За последние 30 дней: 3
Подробная статистика