Details

Выступкин, Владимир Александрович. Алгоритмы автоматического распознавания логико-грамматической структуры предложений [Электронный ресурс]: магистерская диссертация: 01.04.02 / В. А. Выступкин; Санкт-Петербургский политехнический университет Петра Великого, Институт прикладной математики и механики ; науч. рук. А. А. Иванков. — Электрон. текстовые дан. (1 файл : 19,9 МБ). — Санкт-Петербург, 2016. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v17-1399.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v17-1399>.

Record create date: 3/14/2017

Subject: Алгоритмы; Информация — Обработка; Компьютерное моделирование; естественные языки; лучевой поиск

UDC: 004.912:004.421'414(043.3)

Collections: Выпускные квалификационные работы; Общая коллекция

Links: DOI

Allowed Actions: Read Download (19.9 Mb) You need Flash Player to read document

Group: Anonymous

Network: Internet

Annotation

Объектом исследования являются алгоритмы построения логико-грамматической структуры предложения. Цель работы - исследование и модификация алгоритмов построения AMR представлений логико-грамматической структуры предложения. В ходе работы была разработана и реализована модификация алгоритма CAMR с заменой жадной стратегии на лучевой поиск с применением стратегии раннего обновления, предложенной Стэнфордским университетом для обучения модели. Данная модификация позволила увеличить показатели F-меры на 0.6% для выборки LDC2014T12-proxy и на 0.9% для выборки LittlePrince по сравнению с оригинальной реализацией алгоритма. Был разработан реализован приближенный алгоритм нахождения синтаксического дерева вывода предложения на основе LR0 анализатора для бинарной КС грамматики ЕЯ, позволяющий увеличить показатели F-меры на 0.2% на выборке WallStreetJournal по сравнению с алгоритмом Shift-Reduce. Данная реализация была применена к алгоритму CAMR как замена алгоритму Charniak построения дерева составляющих и позволила в 7 раз увеличить скорость работы CAMR при потере показателя F-меры на 1.5% и 1.3% для выборок LittlePrince и LDC2014T12-proxy по сравнению с оригинальной реализацией алгоритма CAMR.

Document access rights

Network User group Action
FL SPbPU Local Network All Read Print Download
-> Internet All Read Print Download

Document usage statistics

stat Document access count: 206
Last 30 days: 2
Detailed usage statistics