Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных

Кузнецов, Павел Сергеевич

Детальная информация

Название	Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных
Авторы	Кузнецов Павел Сергеевич
Научный руководитель	Иванков Алексей Александрович
Другие авторы	Арефьева Людмила Анатольевна
Организация	Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения	Санкт-Петербург, 2019
Коллекция	Выпускные квалификационные работы ; Общая коллекция
Тематика	Вычислительные машины электронные — Программы прикладные ; анализ текстов на естественных языках ; синтаксический анализ ; грамматики зависимостей ; грамматики составляющих ; билексическая грамматика ; вероятностная контекстно-независимая грамматика ; контекстно-зависимая грамматика ; стэнфордский парсер
УДК	004.4'413
Тип документа	Выпускная квалификационная работа магистра
Язык	Русский
Уровень высшего образования	Магистратура
Код специальности ФГОС	01.04.02
Группа специальностей ФГОС	010000 - Математика и механика
Ссылки	Отзыв руководителя ; Рецензия ; Отчет о проверке на объем и корректность внешних заимствований
DOI	10.18720/SPBPU/3/2019/vr/vr19-2291
Права доступа	Доступ по паролю из сети Интернет (чтение)
Ключ записи	ru\spstu\vkr\5895
Дата создания записи	18.03.2020

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

В данной работе изложен итеративный алгоритм синтаксического анализа, основанный на композиции различных типов грамматик. В ходе работы приведена классификация основных ошибок, допускаемых алгоритмами Стэнфордского парсера при синтаксическом разборе корпуса из 400 предложений словаря по тематике «Computer Science». Приведены результаты тестирования построенного алгоритма. На основе полученных результатов представлена статистика допускаемых алгоритмом ошибок. Проведено сравнение оценок вероятности появления типичных ошибок в результатах разбора как оригинальными алгоритмами, так и предложенными в настоящей работе.

This paper presents our new iterative parsing algorithm based on the composition of various types of grammars. The classification of parsing tree mistakes is given for 400 sentences which had been produced by original Stanford parser algorithms and our one. The results of developed algorithm testing are given, as well as the statistics of parsing trees errors. The parsing results of both the original algorithm and our composition are compered with respect to probability of typical errors.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

Количество обращений: 33
За последние 30 дней: 0

Подробная статистика