Details

Title: Применение методов обработки естественного языка в рекомендательных системах: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Creators: Шульгин Сергей Александрович
Scientific adviser: Бендерская Елена Николаевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint: Санкт-Петербург, 2024
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: рекомендательная система; векторизация пользовательских предпочтений; пользовательское пространство эмбеддингов; Doc2Vec; K-Medoids; косинусное сходство; recommender system; vectorizing of user preferences; user embeddings space; cosine similarity
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-2633
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally: New arrival
Record key: ru\spstu\vkr\30313

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Цель работы заключается в разработке ядра конкурентноспособной рекомендательной системы с учётом последних достижений в области машинного обучения. Были рассмотрены различные методы построения рекомендательных систем, а также проблемы, возникающие при их реализации, и возможные пути их решения. Кроме того проанализированы способы применения методов обработки естественного языка в разработке рекомендательных систем. В рамках выпускной квалификационной работы была предложена модель векторизации пользовательских предпочтений Pref2Vec как основа гибридной рекомендательной системы. Модель использует одно из наиболее актуальных методов обработки естественного языка – векторизацию, а также расширяет функциональность библиотеки Gensim. К тоже же был предложен класс пользовательского пространства эмбеддингов UES, который используется при построении модели Pref2Vec и который позволяет векторизовать предпочтения конечного пользователя посредством применения нового способа векторизации текстовых данных, при помощи которого учитывается вид взаимодействия пользователя с рассматриваемыми данными. Тестирование разработанной системы и сравнительный анализ полученных значений метрик Recall@k и NCDG@k показали, что результаты оценки качества модели Pref2Vec сравнимы с показателями моделей BPRMF, GRU4Rec и NextItRec, что говорит о перспективности разработанного ЯРС.

The purpose of the thesis is to analyze the various machine learning methods in the development of recommender systems and to develop the core of a competitive recommender system. Main aspects of the recommender system development were considered: methods for constructing recommender systems, problems of its implementation, ways to solve the problems and ways to apply machine learning methods in the development. As one of the results, a model of vectorizing user preferences Pref2Vec was proposed as the basis of a hybrid recommender system. The model uses one of the most current methods of natural language processing – vectorization, and also expands the functionality of the Gensim library. In addition, a user space embedding class UES was proposed, which is used in building of the Pref2Vec model and which allows to vectorize end-user preferences by a new method of vectorizing text data, which allows to consider the type of user interaction with the data. Testing of the Pref2vec and comparative analysis of the Recall@k and NCDG@k metrics indicate that the achieving quality of the Pref2Vec model is comparable with the baselines of the BPRMF, GRU4Rec and NextItRec models, which indicates the prospects of the developed core of a recommender system.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 1
Last 30 days: 1
Detailed usage statistics