Details

Title Методы машинного обучения в задаче распознавания рукописного текста: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_02 «Организация и управление суперкомпьютерными системами»
Creators Черников Степан Георгиевич
Scientific adviser Попов Сергей Геннадьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects распознавание рукописного текста; компьютерное зрение; нейронные сети; машинное обучение; handwritten text recognition; computer vision; neural networks; machine learning
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 02.04.01
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2024/vr/vr24-5641
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\33233
Record create date 8/29/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

На сегодняшний день во многих предметных областях существует значительный массив рукописных документов и необходимость систематизировать содержащуюся в нем информацию, представив ее в машиночитаемом виде. Сложность данной операции состоит в том, что, в отличие от печатных, рукописные шрифты обладают большой изменчивостью как со временем, так и в рамках одного периода. Существующие на данный момент решения имеют точность, которая неприемлема на практике, поэтому проблема актуальна на данный момент. В данной работе изучается задача распознавания рукописного кириллического текста. Рассматриваются предложенные ранее актуальные решения данной задачи, предлагается общая структура алгоритма распознавания, методы решения подзадач и программная реализация отдельных модулей. Разработанный метод распознавания текста основан на выделении в тексте отдельных слов и их распознавания при помощи нейронной сети. Для обучения сети предложен метод формирования синтетической выборки произвольного размера, обеспечивающей изменчивость в почерке и возможность учета помарок в тексте. Для генерации синтетической выборки используется вспомогательную модель распознавания слов и применяется метод валидации образцов символов. В рамках работы решаются задачи предобработки изображения, выделения на нем границ слов и непосредственно обучения модели для распознавания текста. Решается задача построения жизненного цикла двух нейронных сетей: основной и вспомогательной.

Today, in many subject areas, there is a significant amount of handwritten documents and the need to systematize the information contained in it, presenting it in machine-readable form. The complexity of this operation lies in the fact that, unlike printed ones, handwritten fonts exhibit great variability both over time and within one period. Currently existing solutions have an accuracy that is unacceptable in practice, so the problem is relevant at the moment. In this paper, we study the problem of recognizing handwritten Cyrillic text. Previously proposed relevant solutions to this problem are considered, the general structure of the recognition algorithm, methods for solving subtasks and software implementation of individual modules are proposed. The developed text recognition method is based on identifying individual words in the text and recognizing them using a neural network. To train the network, a method is proposed for generating a synthetic sample of arbitrary size, which ensures variability in handwriting and the ability to take into account blots in the text. To generate a synthetic sample, an auxiliary word recognition model is used and a character sample validation method is applied. As part of the work, the problems of image preprocessing, highlighting word boundaries on it, and directly training the model for text recognition are solved. The problem of constructing the life cycle of two neural networks is solved: the main and auxiliary ones.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 2 
Last 30 days: 0

Detailed usage statistics