Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных

Кузнецов, Павел Сергеевич

Details

	Table	Card	RUSMARC

Title:	Композиция алгоритмов разбора текстов на естественном языке: выпускная квалификационная работа магистра: направление 01.04.02 Прикладная математика и информатика ; образовательная программа 01.04.02_02 Математические методы анализа и визуализации данных
Creators:	Кузнецов Павел Сергеевич
Scientific adviser:	Иванков Алексей Александрович
Other creators:	Арефьева Людмила Анатольевна
Organization:	Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint:	Санкт-Петербург, 2019
Collection:	Выпускные квалификационные работы; Общая коллекция
Subjects:	Вычислительные машины электронные — Программы прикладные; анализ текстов на естественных языках; синтаксический анализ; грамматики зависимостей; грамматики составляющих; билексическая грамматика; вероятностная контекстно-независимая грамматика; контекстно-зависимая грамматика; стэнфордский парсер
UDC:	004.4'413
Document type:	Master graduation qualification work
File type:	PDF
Language:	Russian
Level of education:	Master
Speciality code (FGOS):	01.04.02
Speciality group (FGOS):	010000 - Математика и механика
Links:	Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI:	10.18720/SPBPU/3/2019/vr/vr19-2291
Rights:	Доступ по паролю из сети Интернет (чтение)
Record key:	ru\spstu\vkr\5895

Allowed Actions: –

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе изложен итеративный алгоритм синтаксического анализа, основанный на композиции различных типов грамматик. В ходе работы приведена классификация основных ошибок, допускаемых алгоритмами Стэнфордского парсера при синтаксическом разборе корпуса из 400 предложений словаря по тематике «Computer Science». Приведены результаты тестирования построенного алгоритма. На основе полученных результатов представлена статистика допускаемых алгоритмом ошибок. Проведено сравнение оценок вероятности появления типичных ошибок в результатах разбора как оригинальными алгоритмами, так и предложенными в настоящей работе.

This paper presents our new iterative parsing algorithm based on the composition of various types of grammars. The classification of parsing tree mistakes is given for 400 sentences which had been produced by original Stanford parser algorithms and our one. The results of developed algorithm testing are given, as well as the statistics of parsing trees errors. The parsing results of both the original algorithm and our composition are compered with respect to probability of typical errors.

Document access rights

	Network		User group		Action
	ILC SPbPU Local Network		All
	Internet		Authorized users SPbPU
	Internet		Anonymous

Usage statistics

Access count: 31
Last 30 days: 0
Detailed usage statistics