Details

Коваленко, Татьяна Викторовна. Метод программного построения векторной модели неформализованного текста на естественном языке на основе морфемного синтаксического анализатора [Электронный ресурс]: выпускная квалификационная работа магистра: 09.04.04 - Программная инженерия ; 09.04.04_01 - Технология разработки и сопровождения качественного программного продукта / Т. В. Коваленко; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. И. В. Никифоров. — Электрон. текстовые дан. (1 файл : 3,01 Мб). — Санкт-Петербург, 2018. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v18-1447.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v18-1447>. — <URL:http://elib.spbstu.ru/dl/2/rev/v18-1447-o.pdf>. — <URL:http://elib.spbstu.ru/dl/2/rev/v18-1447-r.pdf>.

Record create date: 11/9/2018

Subject: Нейронные сети; тексты; машинное обучение

UDC: 004.032.26; 004.912

Collections: Выпускные квалификационные работы; Общая коллекция

Links: DOI; Отзыв руководителя; Рецензия

Allowed Actions: Read Download (3.0 Mb) You need Flash Player to read document

Group: Anonymous

Network: Internet

Annotation

Выпускная квалификационная работа магистра посвящена исследованию существующих методов построения векторных моделей текста, применяющихся в задачах обработки и анализа текстов; разработке нового метода построения векторной модели текста на основе морфемного синтаксического анализа слов, а также применение его для решения задачи классификации текстов. В работе дан обзор существующих подходов к решению задачи классификации текстов, как одной из областей применения векторных моделей текстов. Описаны методы построения векторных моделей текстов, проведён их сравнительный анализ. Описаны подходы к морфемному анализу слов, проведено сравнение существующих алгоритмов разбиения слов на морфемы. Предложен и реализован в программном средстве новый метод построения векторной модели текста на основе морфемного анализа слов. Описаны придуманные и разработанные два алгоритма разбиения слов на морфемы: алгоритм разбиения слов на морфемы на основе вероятностного подхода и алгоритм разбиения слов на морфемы методом перебора. Обоснован выбор одного из придуманных алгоритмов для разбиения корпуса текстов на морфемы и построения на его основе морфемной векторной модели текста. Описывается применение полученной морфемной векторной модели текста для обучения классификатора текстов – рекуррентной нейронной сети с долгосрочной памятью. В работе приведено сравнение полученных результатов применения построенного классификатора для решения задачи классификации текстов на несколько заранее заданных классов с результатами применения классификатора, для обучения которого использовалась словная векторная модель текста. Сделаны соответствующие выводы.

Document access rights

Network User group Action
FL SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Document usage statistics

stat Document access count: 0
Last 30 days: 0
Detailed usage statistics