Детальная информация

Коваленко, Татьяна Викторовна. Метод программного построения векторной модели неформализованного текста на естественном языке на основе морфемного синтаксического анализатора [Электронный ресурс]: выпускная квалификационная работа магистра: 09.04.04 - Программная инженерия ; 09.04.04_01 - Технология разработки и сопровождения качественного программного продукта / Т. В. Коваленко; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. И. В. Никифоров. — Электрон. текстовые дан. (1 файл : 3,01 Мб). — Санкт-Петербург, 2018. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v18-1447.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v18-1447>. — <URL:http://elib.spbstu.ru/dl/2/rev/v18-1447-o.pdf>. — <URL:http://elib.spbstu.ru/dl/2/rev/v18-1447-r.pdf>.

Дата создания записи: 09.11.2018

Тематика: Нейронные сети; тексты; машинное обучение

УДК: 004.032.26; 004.912

Коллекции: Выпускные квалификационные работы; Общая коллекция

Ссылки: DOI; Отзыв руководителя; Рецензия

Разрешенные действия: Прочитать Загрузить (3,0 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Выпускная квалификационная работа магистра посвящена исследованию существующих методов построения векторных моделей текста, применяющихся в задачах обработки и анализа текстов; разработке нового метода построения векторной модели текста на основе морфемного синтаксического анализа слов, а также применение его для решения задачи классификации текстов. В работе дан обзор существующих подходов к решению задачи классификации текстов, как одной из областей применения векторных моделей текстов. Описаны методы построения векторных моделей текстов, проведён их сравнительный анализ. Описаны подходы к морфемному анализу слов, проведено сравнение существующих алгоритмов разбиения слов на морфемы. Предложен и реализован в программном средстве новый метод построения векторной модели текста на основе морфемного анализа слов. Описаны придуманные и разработанные два алгоритма разбиения слов на морфемы: алгоритм разбиения слов на морфемы на основе вероятностного подхода и алгоритм разбиения слов на морфемы методом перебора. Обоснован выбор одного из придуманных алгоритмов для разбиения корпуса текстов на морфемы и построения на его основе морфемной векторной модели текста. Описывается применение полученной морфемной векторной модели текста для обучения классификатора текстов – рекуррентной нейронной сети с долгосрочной памятью. В работе приведено сравнение полученных результатов применения построенного классификатора для решения задачи классификации текстов на несколько заранее заданных классов с результатами применения классификатора, для обучения которого использовалась словная векторная модель текста. Сделаны соответствующие выводы.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ФБ СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 191
За последние 30 дней: 121
Подробная статистика