Детальная информация

Название: Разработка и исследование обучающейся системы поиска научных статей по синонимам: выпускная квалификационная работа магистра: направление 02.04.03 Математическое обеспечение и администрирование информационных систем ; образовательная программа 02.04.03_02 Проектирование и разработка информационных систем
Авторы: Бутрович Галина Михайловна
Научный руководитель: Сабинин Олег Юрьевич
Другие авторы: Заковряшин Юрий Дмитриевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Информационный поиск; векторное представление слов; машинное обучение; извлечение информации
УДК: 004.8
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 02.04.03
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-322
Права доступа: Доступ по паролю из сети Интернет (чтение, печать)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Целью представленной работы является разработка и исследование системы поиска научных статей по синонимам ключевых слов. В основу поиска синонимов было положено векторное представление слов и алгоритм word2vec (модель skip-gram). Обучающий корпус был составлен из рефератов научных статей биомедицинской базы PubMed. Была предложена архитектура системы поиска, разработана сама система, проведено тестирование ее работы и анализ полученных результатов.

The purpose of this master thesis is to develop a synonym search system based on word embeddings. The word vectors were trained by using the word2vec (skip-gram) model. The skip-gram architecture uses the focus word as the single input layer, and the target contextual words as the output prediction layer. The training data set contained the abstracts from PubMed, which is an online database of freely available biomedical literature. The research includes the design, development, testing of a synonym search system and results analysis.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать
Интернет Авторизованные пользователи СПбПУ Прочитать Печать
Интернет Авторизованные пользователи (не СПбПУ)
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 14
За последние 30 дней: 0
Подробная статистика