Детальная информация

Название: Метод программного построения векторной модели неформализованного текста на естественном языке на основе морфемного синтаксического анализатора: выпускная квалификационная работа магистра: 09.04.04 - Программная инженерия ; 09.04.04_01 - Технология разработки и сопровождения качественного программного продукта
Авторы: Коваленко Татьяна Викторовна
Научный руководитель: Никифоров Игорь Валерьевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2018
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Нейронные сети; тексты; машинное обучение
УДК: 004.032.26; 004.912
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 09.04.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия
DOI: 10.18720/SPBPU/2/v18-1447
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Выпускная квалификационная работа магистра посвящена исследованию существующих методов построения векторных моделей текста, применяющихся в задачах обработки и анализа текстов; разработке нового метода построения векторной модели текста на основе морфемного синтаксического анализа слов, а также применение его для решения задачи классификации текстов. В работе дан обзор существующих подходов к решению задачи классификации текстов, как одной из областей применения векторных моделей текстов. Описаны методы построения векторных моделей текстов, проведён их сравнительный анализ. Описаны подходы к морфемному анализу слов, проведено сравнение существующих алгоритмов разбиения слов на морфемы. Предложен и реализован в программном средстве новый метод построения векторной модели текста на основе морфемного анализа слов. Описаны придуманные и разработанные два алгоритма разбиения слов на морфемы: алгоритм разбиения слов на морфемы на основе вероятностного подхода и алгоритм разбиения слов на морфемы методом перебора. Обоснован выбор одного из придуманных алгоритмов для разбиения корпуса текстов на морфемы и построения на его основе морфемной векторной модели текста. Описывается применение полученной морфемной векторной модели текста для обучения классификатора текстов – рекуррентной нейронной сети с долгосрочной памятью. В работе приведено сравнение полученных результатов применения построенного классификатора для решения задачи классификации текстов на несколько заранее заданных классов с результатами применения классификатора, для обучения которого использовалась словная векторная модель текста. Сделаны соответствующие выводы.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
Интернет Авторизованные пользователи (не СПбПУ)
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 227
За последние 30 дней: 0
Подробная статистика