Details

Title: Разработка и исследование обучающейся системы поиска научных статей по синонимам: выпускная квалификационная работа магистра: направление 02.04.03 Математическое обеспечение и администрирование информационных систем ; образовательная программа 02.04.03_02 Проектирование и разработка информационных систем
Creators: Бутрович Галина Михайловна
Scientific adviser: Сабинин Олег Юрьевич
Other creators: Заковряшин Юрий Дмитриевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Информационный поиск; векторное представление слов; машинное обучение; извлечение информации
UDC: 004.8
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 02.04.03
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-322
Rights: Доступ по паролю из сети Интернет (чтение, печать)
Record key: ru\spstu\vkr\5651

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Целью представленной работы является разработка и исследование системы поиска научных статей по синонимам ключевых слов. В основу поиска синонимов было положено векторное представление слов и алгоритм word2vec (модель skip-gram). Обучающий корпус был составлен из рефератов научных статей биомедицинской базы PubMed. Была предложена архитектура системы поиска, разработана сама система, проведено тестирование ее работы и анализ полученных результатов.

The purpose of this master thesis is to develop a synonym search system based on word embeddings. The word vectors were trained by using the word2vec (skip-gram) model. The skip-gram architecture uses the focus word as the single input layer, and the target contextual words as the output prediction layer. The training data set contained the abstracts from PubMed, which is an online database of freely available biomedical literature. The research includes the design, development, testing of a synonym search system and results analysis.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
Internet Authorized users SPbPU Read Print
-> Internet Anonymous

Usage statistics

stat Access count: 19
Last 30 days: 0
Detailed usage statistics