Метод программного построения векторной модели неформализованного текста на естественном языке на основе морфемного синтаксического анализатора: выпускная квалификационная работа магистра: 09.04.04 - Программная инженерия ; 09.04.04_01 - Технология разработки и сопровождения качественного программного продукта

Коваленко, Татьяна Викторовна

Детальная информация

Название	Метод программного построения векторной модели неформализованного текста на естественном языке на основе морфемного синтаксического анализатора: выпускная квалификационная работа магистра: 09.04.04 - Программная инженерия ; 09.04.04_01 - Технология разработки и сопровождения качественного программного продукта
Авторы	Коваленко Татьяна Викторовна
Научный руководитель	Никифоров Игорь Валерьевич
Организация	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения	Санкт-Петербург, 2018
Коллекция	Выпускные квалификационные работы ; Общая коллекция
Тематика	Нейронные сети ; тексты ; машинное обучение
УДК	004.032.26; 004.912
Тип документа	Выпускная квалификационная работа магистра
Язык	Русский
Уровень высшего образования	Магистратура
Код специальности ФГОС	09.04.04
Группа специальностей ФГОС	090000 - Информатика и вычислительная техника
Ссылки	Отзыв руководителя ; Рецензия
DOI	10.18720/SPBPU/2/v18-1447
Права доступа	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи	RU\SPSTU\edoc\56149
Дата создания записи	09.11.2018

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

Выпускная квалификационная работа магистра посвящена исследованию существующих методов построения векторных моделей текста, применяющихся в задачах обработки и анализа текстов; разработке нового метода построения векторной модели текста на основе морфемного синтаксического анализа слов, а также применение его для решения задачи классификации текстов. В работе дан обзор существующих подходов к решению задачи классификации текстов, как одной из областей применения векторных моделей текстов. Описаны методы построения векторных моделей текстов, проведён их сравнительный анализ. Описаны подходы к морфемному анализу слов, проведено сравнение существующих алгоритмов разбиения слов на морфемы. Предложен и реализован в программном средстве новый метод построения векторной модели текста на основе морфемного анализа слов. Описаны придуманные и разработанные два алгоритма разбиения слов на морфемы: алгоритм разбиения слов на морфемы на основе вероятностного подхода и алгоритм разбиения слов на морфемы методом перебора. Обоснован выбор одного из придуманных алгоритмов для разбиения корпуса текстов на морфемы и построения на его основе морфемной векторной модели текста. Описывается применение полученной морфемной векторной модели текста для обучения классификатора текстов – рекуррентной нейронной сети с долгосрочной памятью. В работе приведено сравнение полученных результатов применения построенного классификатора для решения задачи классификации текстов на несколько заранее заданных классов с результатами применения классификатора, для обучения которого использовалась словная векторная модель текста. Сделаны соответствующие выводы.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

...