С 17 марта 2020 г. для ресурсов (учебные, научные, материалы конференций, статьи из периодических изданий, авторефераты диссертаций, диссертации) ЭБ СПбПУ, обеспечивающих образовательный процесс, установлен особый режим использования. Обращаем внимание, что ВКР/НД не относятся к этой категории.

Details

Title: Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных
Creators: Кузнецов Павел Сергеевич
Scientific adviser: Иванков Алексей Александрович
Other creators: Арефьева Людмила Анатольевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint: Санкт-Петербург, 2019
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: анализ текстов на естественных языках; синтаксический анализ; грамматики зависимостей; грамматики составляющих; билексическая грамматика; вероятностная контекстно-независимая грамматика; контекстно-зависимая грамматика; стэнфордский парсер; natural language processing; parsing; dependency grammars; constituency grammars; bilex grammar; probabilistic context-free grammar; context-sensitive grammar; stanford parser
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 01.04.02
Speciality group (FGOS): 010000 - Математика и механика
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-2291
Rights: Свободный доступ из сети Интернет (чтение)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе изложен итеративный алгоритм синтаксического анализа, основанный на композиции различных типов грамматик. В ходе работы приведена классификация основных ошибок, допускаемых алгоритмами Стэнфордского парсера при синтаксическом разборе корпуса из 400 предложений словаря по тематике «Computer Science». Приведены результаты тестирования построенного алгоритма. На основе полученных результатов представлена статистика допускаемых алгоритмом ошибок. Проведено сравнение оценок вероятности появления типичных ошибок в результатах разбора как оригинальными алгоритмами, так и предложенными в настоящей работе.

This paper presents our new iterative parsing algorithm based on the composition of various types of grammars. The classification of parsing tree mistakes is given for 400 sentences which had been produced by original Stanford parser algorithms and our one. The results of developed algorithm testing are given, as well as the statistics of parsing trees errors. The parsing results of both the original algorithm and our composition are compered with respect to probability of typical errors.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users Read
-> Internet Anonymous

Usage statistics

stat Access count: 8
Last 30 days: 0
Detailed usage statistics