Details

Title: Алгоритмы автоматического распознавания логико-грамматической структуры предложений: магистерская диссертация: 01.04.02
Creators: Выступкин Владимир Александрович
Scientific adviser: Иванков Алексей Александрович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2016
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Алгоритмы; Информация — Обработка; Компьютерное моделирование; естественные языки; лучевой поиск
UDC: 004.912:004.421'414(043.3)
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 01.04.02
Speciality group (FGOS): 010000 - Математика и механика
DOI: 10.18720/SPBPU/2/v17-1399
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\37441

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Объектом исследования являются алгоритмы построения логико-грамматической структуры предложения. Цель работы - исследование и модификация алгоритмов построения AMR представлений логико-грамматической структуры предложения. В ходе работы была разработана и реализована модификация алгоритма CAMR с заменой жадной стратегии на лучевой поиск с применением стратегии раннего обновления, предложенной Стэнфордским университетом для обучения модели. Данная модификация позволила увеличить показатели F-меры на 0.6% для выборки LDC2014T12-proxy и на 0.9% для выборки LittlePrince по сравнению с оригинальной реализацией алгоритма. Был разработан реализован приближенный алгоритм нахождения синтаксического дерева вывода предложения на основе LR0 анализатора для бинарной КС грамматики ЕЯ, позволяющий увеличить показатели F-меры на 0.2% на выборке WallStreetJournal по сравнению с алгоритмом Shift-Reduce. Данная реализация была применена к алгоритму CAMR как замена алгоритму Charniak построения дерева составляющих и позволила в 7 раз увеличить скорость работы CAMR при потере показателя F-меры на 1.5% и 1.3% для выборок LittlePrince и LDC2014T12-proxy по сравнению с оригинальной реализацией алгоритма CAMR.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 232
Last 30 days: 0
Detailed usage statistics