Детальная информация

Название: Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных
Авторы: Кузнецов Павел Сергеевич
Научный руководитель: Иванков Алексей Александрович
Другие авторы: Арефьева Людмила Анатольевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2019
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Вычислительные машины электронные — Программы прикладные; анализ текстов на естественных языках; синтаксический анализ; грамматики зависимостей; грамматики составляющих; билексическая грамматика; вероятностная контекстно-независимая грамматика; контекстно-зависимая грамматика; стэнфордский парсер
УДК: 004.4'413
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 01.04.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-2291
Права доступа: Доступ по паролю из сети Интернет (чтение)
Ключ записи: ru\spstu\vkr\5895

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе изложен итеративный алгоритм синтаксического анализа, основанный на композиции различных типов грамматик. В ходе работы приведена классификация основных ошибок, допускаемых алгоритмами Стэнфордского парсера при синтаксическом разборе корпуса из 400 предложений словаря по тематике «Computer Science». Приведены результаты тестирования построенного алгоритма. На основе полученных результатов представлена статистика допускаемых алгоритмом ошибок. Проведено сравнение оценок вероятности появления типичных ошибок в результатах разбора как оригинальными алгоритмами, так и предложенными в настоящей работе.

This paper presents our new iterative parsing algorithm based on the composition of various types of grammars. The classification of parsing tree mistakes is given for 400 sentences which had been produced by original Stanford parser algorithms and our one. The results of developed algorithm testing are given, as well as the statistics of parsing trees errors. The parsing results of both the original algorithm and our composition are compered with respect to probability of typical errors.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 31
За последние 30 дней: 0
Подробная статистика