Детальная информация

Название: Применение методов обработки естественного языка в рекомендательных системах: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Авторы: Шульгин Сергей Александрович
Научный руководитель: Бендерская Елена Николаевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: рекомендательная система; векторизация пользовательских предпочтений; пользовательское пространство эмбеддингов; Doc2Vec; K-Medoids; косинусное сходство; recommender system; vectorizing of user preferences; user embeddings space; cosine similarity
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-2633
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\30313

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Цель работы заключается в разработке ядра конкурентноспособной рекомендательной системы с учётом последних достижений в области машинного обучения. Были рассмотрены различные методы построения рекомендательных систем, а также проблемы, возникающие при их реализации, и возможные пути их решения. Кроме того проанализированы способы применения методов обработки естественного языка в разработке рекомендательных систем. В рамках выпускной квалификационной работы была предложена модель векторизации пользовательских предпочтений Pref2Vec как основа гибридной рекомендательной системы. Модель использует одно из наиболее актуальных методов обработки естественного языка – векторизацию, а также расширяет функциональность библиотеки Gensim. К тоже же был предложен класс пользовательского пространства эмбеддингов UES, который используется при построении модели Pref2Vec и который позволяет векторизовать предпочтения конечного пользователя посредством применения нового способа векторизации текстовых данных, при помощи которого учитывается вид взаимодействия пользователя с рассматриваемыми данными. Тестирование разработанной системы и сравнительный анализ полученных значений метрик Recall@k и NCDG@k показали, что результаты оценки качества модели Pref2Vec сравнимы с показателями моделей BPRMF, GRU4Rec и NextItRec, что говорит о перспективности разработанного ЯРС.

The purpose of the thesis is to analyze the various machine learning methods in the development of recommender systems and to develop the core of a competitive recommender system. Main aspects of the recommender system development were considered: methods for constructing recommender systems, problems of its implementation, ways to solve the problems and ways to apply machine learning methods in the development. As one of the results, a model of vectorizing user preferences Pref2Vec was proposed as the basis of a hybrid recommender system. The model uses one of the most current methods of natural language processing – vectorization, and also expands the functionality of the Gensim library. In addition, a user space embedding class UES was proposed, which is used in building of the Pref2Vec model and which allows to vectorize end-user preferences by a new method of vectorizing text data, which allows to consider the type of user interaction with the data. Testing of the Pref2vec and comparative analysis of the Recall@k and NCDG@k metrics indicate that the achieving quality of the Pref2Vec model is comparable with the baselines of the BPRMF, GRU4Rec and NextItRec models, which indicates the prospects of the developed core of a recommender system.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 1
За последние 30 дней: 1
Подробная статистика