Детальная информация

Название: Алгоритмы автоматического распознавания логико-грамматической структуры предложений: магистерская диссертация: 01.04.02
Авторы: Выступкин Владимир Александрович
Научный руководитель: Иванков Алексей Александрович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2016
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Алгоритмы; Информация — Обработка; Компьютерное моделирование; естественные языки; лучевой поиск
УДК: 004.912:004.421'414(043.3)
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 01.04.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: http://doi.org/10.18720/SPBPU/2/v17-1399

Разрешенные действия: Прочитать Загрузить (19,9 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Локальная сеть ИБК СПбПУ

Аннотация

Объектом исследования являются алгоритмы построения логико-грамматической структуры предложения. Цель работы - исследование и модификация алгоритмов построения AMR представлений логико-грамматической структуры предложения. В ходе работы была разработана и реализована модификация алгоритма CAMR с заменой жадной стратегии на лучевой поиск с применением стратегии раннего обновления, предложенной Стэнфордским университетом для обучения модели. Данная модификация позволила увеличить показатели F-меры на 0.6% для выборки LDC2014T12-proxy и на 0.9% для выборки LittlePrince по сравнению с оригинальной реализацией алгоритма. Был разработан реализован приближенный алгоритм нахождения синтаксического дерева вывода предложения на основе LR0 анализатора для бинарной КС грамматики ЕЯ, позволяющий увеличить показатели F-меры на 0.2% на выборке WallStreetJournal по сравнению с алгоритмом Shift-Reduce. Данная реализация была применена к алгоритму CAMR как замена алгоритму Charniak построения дерева составляющих и позволила в 7 раз увеличить скорость работы CAMR при потере показателя F-меры на 1.5% и 1.3% для выборок LittlePrince и LDC2014T12-proxy по сравнению с оригинальной реализацией алгоритма CAMR.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
-> Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 209
За последние 30 дней: 2
Подробная статистика