Details

Title: Разработка и реализация алгоритма формирования текста по шаблону с учетом грамматики языка: выпускная квалификационная работа бакалавра: направление 02.03.02 «Фундаментальная информатика и информационные технологии» ; образовательная программа 02.03.02_02 «Информатика и компьютерные науки»
Creators: Щеголева Анастасия Сергеевна
Scientific adviser: Самочадин Александр Викторович
Other creators: Трифонов Петр Владимирович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: диалоговый ассистент; генерация текста; обработка естественных языков; dialogue assistant; text generation; natural language processing
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 02.03.02
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-892
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Разработка и реализация алгоритма формирования текста по шаблону с учетом грамматики языка». Целью работы является разработка и реализация алгоритма для диалогового ассистента, позволяющего правильно формировать текст по конкретному шаблону, учитывая правила грамматики языка с использованием заранее созданных примеров корректной подстановки. Алгоритм работает для русского и английского языков. Задачи, которые решались в ходе исследования: 1. Создание алгоритма формирования текста по шаблону. Описывается подстановка в шаблон дат, времени, денежных единиц, а также существительных в единственном или множественном числе. 2. Создание алгоритма словоизменения. Особое внимание уделяется падежному словоизменению, которое производится по схемам, составленным на основе классификации слов, предложенной А.А. Зализняком. 3. Реализация разработанных алгоритмов. В данной работе описывается алгоритм подстановки, его реализация на языке Java, а также приводятся результаты тестирования реализации алгоритма. Результатом работы является алгоритм, отвечающий заявленным критериям, а также его реализация на языке Java. Точность подстановки существительных – 85%.

The subject of the graduate qualification work is “Development and implementation of an algorithm for text generation using a template in conformity with grammar of the language”. The aim of the work is to develop and implement an algorithm for a dialogue assistant that allows to form correct text according to a specific template, taking into account the rules of the grammar of the language using pre-created examples of correct substitution. The algorithm works for Russian and English. Tasks that were solved during the study: 1. Development of an algorithm for generating text from a template. Describes the substitution in the template of dates, time, currency units, as well as nouns in the singular or plural. 2. Development of an inflection algorithm. Particular attention is paid to case inflection, which is carried out according to the schemes compiled on the basis of the classification of words proposed by A.A. Zaliznyak. 3. Implementation of the developed algorithms. This paper describes the substitution algorithm, its implementation in the Java language, and also provides the results of testing the implementation of the algorithm. The result of the work is an algorithm that meets the stated criteria, as well as its implementation in the Java language. The accuracy of noun substitution is 85%.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 1
Last 30 days: 1
Detailed usage statistics