Детальная информация

Название Методы машинного обучения в задаче распознавания рукописного текста: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_02 «Организация и управление суперкомпьютерными системами»
Авторы Черников Степан Георгиевич
Научный руководитель Попов Сергей Геннадьевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика распознавание рукописного текста; компьютерное зрение; нейронные сети; машинное обучение; handwritten text recognition; computer vision; neural networks; machine learning
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 02.04.01
Группа специальностей ФГОС 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2024/vr/vr24-5641
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\33233
Дата создания записи 29.08.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

На сегодняшний день во многих предметных областях существует значительный массив рукописных документов и необходимость систематизировать содержащуюся в нем информацию, представив ее в машиночитаемом виде. Сложность данной операции состоит в том, что, в отличие от печатных, рукописные шрифты обладают большой изменчивостью как со временем, так и в рамках одного периода. Существующие на данный момент решения имеют точность, которая неприемлема на практике, поэтому проблема актуальна на данный момент. В данной работе изучается задача распознавания рукописного кириллического текста. Рассматриваются предложенные ранее актуальные решения данной задачи, предлагается общая структура алгоритма распознавания, методы решения подзадач и программная реализация отдельных модулей. Разработанный метод распознавания текста основан на выделении в тексте отдельных слов и их распознавания при помощи нейронной сети. Для обучения сети предложен метод формирования синтетической выборки произвольного размера, обеспечивающей изменчивость в почерке и возможность учета помарок в тексте. Для генерации синтетической выборки используется вспомогательную модель распознавания слов и применяется метод валидации образцов символов. В рамках работы решаются задачи предобработки изображения, выделения на нем границ слов и непосредственно обучения модели для распознавания текста. Решается задача построения жизненного цикла двух нейронных сетей: основной и вспомогательной.

Today, in many subject areas, there is a significant amount of handwritten documents and the need to systematize the information contained in it, presenting it in machine-readable form. The complexity of this operation lies in the fact that, unlike printed ones, handwritten fonts exhibit great variability both over time and within one period. Currently existing solutions have an accuracy that is unacceptable in practice, so the problem is relevant at the moment. In this paper, we study the problem of recognizing handwritten Cyrillic text. Previously proposed relevant solutions to this problem are considered, the general structure of the recognition algorithm, methods for solving subtasks and software implementation of individual modules are proposed. The developed text recognition method is based on identifying individual words in the text and recognizing them using a neural network. To train the network, a method is proposed for generating a synthetic sample of arbitrary size, which ensures variability in handwriting and the ability to take into account blots in the text. To generate a synthetic sample, an auxiliary word recognition model is used and a character sample validation method is applied. As part of the work, the problems of image preprocessing, highlighting word boundaries on it, and directly training the model for text recognition are solved. The problem of constructing the life cycle of two neural networks is solved: the main and auxiliary ones.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 2 
За последние 30 дней: 0

Подробная статистика