Детальная информация

Название: Разработка системы анализа интересов пользователя на основе действий в социальной сети: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Авторы: Монастырев Виталий Викторович
Научный руководитель: Дробинцев Павел Дмитриевич
Другие авторы: Локшина Екатерина Геннадиевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; искусственный интеллект; рекомендательная система; обработка текста; распознавание изображений; machine learning; artificial intelligence; recommendation system; natural language processing; image recognition
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-994
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\6482

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Объект разработки – модули обработки данных, модули машинного обучения, интегрированные между собой. Данные модули будут заниматься обработкой текста и изображений. Цель работы – рекомендательная система, позволяющая выделять группы пользователей по интересам на основе их действий в социальной сети. Исходный набор данных содержит изображения, тексты, геометки и записи рейтинга публикаций. Для предоставленного набора данных рассматривается архитектура, учитывающая тип данных. В зависимости от типа данных в работе рассматриваются модели машинного обучения, которые обрабатывают эти данные. Для каждой из рассмотренных в работе моделей приводятся метрики и результаты, полученные в результате работы модели. Для объединения результатов работы моделей предлагается запись всей обработанной информации в реляционную базу данных. Для выделения целевой аудитории или целевых записей из базы данных в работе приводятся примеры запросов к данной базе данных. Рекомендательная система была успешно разработана и включает в себя один модуль распознавания изображений и два модуля обработки текста. Дополнительно при поиске целевых пользователей или записей была использована информация о геолокации и рейтинге записей. Работа системы была протестирована на реальных данных. Рассмотренная в работе архитектура рекомендательной системы может быть интегрирована в небольшие проекты.

The object of development is data processing modules and machine learning modules integrated with each other. These modules will handle the processing of text and images. The purpose of this work is a recommendation system that allows you to identify groups of users by interests based on their actions in the social network. The source data set contains images, texts, geotags, and publication rating records. For the provided data set, we consider an architecture that takes into account the data type. Depending on the data type, we consider machine learning models that process this data. For each of the models considered in this paper, the metrics and results obtained as a result of the model are given. To combine the results of the models, it is proposed to record all processed information in a relational database. To select the target audience or target records from the database, the paper provides examples of queries to this database. The recommendation system was successfully developed and includes one im-age recognition module and two text processing modules. Additionally, when search-ing for target users or records, information about the geolocation and rating of records was used. The system was tested on real data. The recommendation system ar-chitecture discussed in this paper can be integrated into small projects.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Внешние организации №2 Все Прочитать
Внешние организации №1 Все
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
Интернет Авторизованные пользователи (не СПбПУ, №2) Прочитать
Интернет Авторизованные пользователи (не СПбПУ, №1)
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 15
За последние 30 дней: 0
Подробная статистика