Details

Title: Разработка системы анализа интересов пользователя на основе действий в социальной сети: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Creators: Монастырев Виталий Викторович
Scientific adviser: Дробинцев Павел Дмитриевич
Other creators: Локшина Екатерина Геннадиевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: машинное обучение; искусственный интеллект; рекомендательная система; обработка текста; распознавание изображений; machine learning; artificial intelligence; recommendation system; natural language processing; image recognition
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.04
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-994
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\6482

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Объект разработки – модули обработки данных, модули машинного обучения, интегрированные между собой. Данные модули будут заниматься обработкой текста и изображений. Цель работы – рекомендательная система, позволяющая выделять группы пользователей по интересам на основе их действий в социальной сети. Исходный набор данных содержит изображения, тексты, геометки и записи рейтинга публикаций. Для предоставленного набора данных рассматривается архитектура, учитывающая тип данных. В зависимости от типа данных в работе рассматриваются модели машинного обучения, которые обрабатывают эти данные. Для каждой из рассмотренных в работе моделей приводятся метрики и результаты, полученные в результате работы модели. Для объединения результатов работы моделей предлагается запись всей обработанной информации в реляционную базу данных. Для выделения целевой аудитории или целевых записей из базы данных в работе приводятся примеры запросов к данной базе данных. Рекомендательная система была успешно разработана и включает в себя один модуль распознавания изображений и два модуля обработки текста. Дополнительно при поиске целевых пользователей или записей была использована информация о геолокации и рейтинге записей. Работа системы была протестирована на реальных данных. Рассмотренная в работе архитектура рекомендательной системы может быть интегрирована в небольшие проекты.

The object of development is data processing modules and machine learning modules integrated with each other. These modules will handle the processing of text and images. The purpose of this work is a recommendation system that allows you to identify groups of users by interests based on their actions in the social network. The source data set contains images, texts, geotags, and publication rating records. For the provided data set, we consider an architecture that takes into account the data type. Depending on the data type, we consider machine learning models that process this data. For each of the models considered in this paper, the metrics and results obtained as a result of the model are given. To combine the results of the models, it is proposed to record all processed information in a relational database. To select the target audience or target records from the database, the paper provides examples of queries to this database. The recommendation system was successfully developed and includes one im-age recognition module and two text processing modules. Additionally, when search-ing for target users or records, information about the geolocation and rating of records was used. The system was tested on real data. The recommendation system ar-chitecture discussed in this paper can be integrated into small projects.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 16
Last 30 days: 1
Detailed usage statistics