Details

Title: Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных
Creators: Кузнецов Павел Сергеевич
Scientific adviser: Иванков Алексей Александрович
Other creators: Арефьева Людмила Анатольевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2019
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Вычислительные машины электронные — Программы прикладные; анализ текстов на естественных языках; синтаксический анализ; грамматики зависимостей; грамматики составляющих; билексическая грамматика; вероятностная контекстно-независимая грамматика; контекстно-зависимая грамматика; стэнфордский парсер
UDC: 004.4'413
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 01.04.02
Speciality group (FGOS): 010000 - Математика и механика
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-2291
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе изложен итеративный алгоритм синтаксического анализа, основанный на композиции различных типов грамматик. В ходе работы приведена классификация основных ошибок, допускаемых алгоритмами Стэнфордского парсера при синтаксическом разборе корпуса из 400 предложений словаря по тематике «Computer Science». Приведены результаты тестирования построенного алгоритма. На основе полученных результатов представлена статистика допускаемых алгоритмом ошибок. Проведено сравнение оценок вероятности появления типичных ошибок в результатах разбора как оригинальными алгоритмами, так и предложенными в настоящей работе.

This paper presents our new iterative parsing algorithm based on the composition of various types of grammars. The classification of parsing tree mistakes is given for 400 sentences which had been produced by original Stanford parser algorithms and our one. The results of developed algorithm testing are given, as well as the statistics of parsing trees errors. The parsing results of both the original algorithm and our composition are compered with respect to probability of typical errors.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 10
Last 30 days: 0
Detailed usage statistics