Применение полуконтролируемого машинного обучения к задаче обнаружения символов Брайля на фотоснимках: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика»

Зуев, Валерий Александрович

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Применение полуконтролируемого машинного обучения к задаче обнаружения символов Брайля на фотоснимках: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика»
Авторы:	Зуев Валерий Александрович
Научный руководитель:	Уткин Лев Владимирович
Другие авторы:	Арефьева Людмила Анатольевна; Яковлев Дмитрий Владиславович
Организация:	Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения:	Санкт-Петербург, 2021
Коллекция:	Выпускные квалификационные работы; Общая коллекция
Тематика:	оптическое распознавание символов; свёрточная нейронная сеть; полуконтролируемое машинное обучение; выравнивание последовательностей; шрифт брайля; optical character recognition; convolutional neural network; semi-supervised machine learning; sequence alignment; braille
Тип документа:	Выпускная квалификационная работа бакалавра
Тип файла:	PDF
Язык:	Русский
Уровень высшего образования:	Бакалавриат
Код специальности ФГОС:	01.03.02
Группа специальностей ФГОС:	010000 - Математика и механика
Ссылки:	Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI:	10.18720/SPBPU/3/2021/vr/vr21-2251
Права доступа:	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи:	ru\spstu\vkr\13916

Разрешенные действия: –

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В работе рассмотрена задача распознавания символов шрифта Брайля на изображениях; предложен способ улучшения качества работы алгоритмов машинного обучения, решающих эту задачу, основанный на использовании больших объёмов фотографий без аннотаций. Задачи, решённые в рамках исследования: 1. Изучение проблемы распознавания шрифта Брайля, существующих методов решения и наборов данных. 2. Разработка схемы улучшения алгоритма машинного обучения, уже обученного на данных с аннотациями, с помощью данных без аннотаций. 3. Сбор данных – фотографий текста, напечатанного шрифтом Брайля. 4. Применение разработанной схемы и полученных данных к одному из известных ранее алгоритмов распознавания, а также оценка эффективности этой схемы. В работе используется и дорабатывается программа распознавания Angelina Braille Reader, основанная на нейронной сети RetinaNet (изначально обученной на размеченном наборе из 300 фотографий). Разработан и реализован на языке Python3 алгоритм исправления меток, полученных в результате распознавания печатных изданий, с помощью выравнивания распознанного текста и исходного электронного текста издания. Получен набор данных (1731 фотография), к которому применён созданный алгоритм. Как показал эксперимент, исправление меток позволяет дообучить нейронную сеть на новых данных, улучшив распознавание печатного текста. Спроектированный метод может быть применён к любому алгоритму распознавания шрифта Брайля, основанному на машинном обучении. Производимые при этом выравнивания текстов позволяют провести статистический анализ ошибок распознавания.

This study explores the problem of image-based Braille recognition; a data-driven approach is proposed to improve existing machine learning algorithms that solve this problem. The aforementioned approach utilizes large amounts of unlabeled pictures with printed Braille and their source texts, aligning the original and recognized text. During the elaboration of the problem, the following tasks were completed: 1. Studying the problem of optical Braille recognition, existing approaches and data sets. 2. Development of a scheme for improving a machine learning algorithm, pre-trained on labeled data, using unlabeled data. 3. Collecting photos of text printed in Braille. 4. Application of the developed scheme along with collected data to one of the existing recognition algorithms; scheme evaluation. In this work, a program for optical Braille recognition named ”Angelina Braille Reader”, which is based on RetinaNet architecture and initially trained on 300 labeled pictures, is used and modified. An algorithm for correcting labels based on alignment of recognized and original text is developed and implemented. A data set of 1,731 photos has been created, to which the algorithm has been applied. As demonstrated experimentally, correcting labels allows additional training of the neural net on new data which leads to an improvement in the recognition of printed Braille. The developed technique may be applied to any optical Braille recognition algorithm based on machine learning. The alignments made in this process allow a statistical analysis of algorithm errors to be performed.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Авторизованные пользователи СПбПУ
	Интернет		Анонимные пользователи

Введение
Задача распознавания символов Брайля
- Общая постановка задачи и особенности рельефно-точечного шрифта
- Обзор существующих решений
  - Подходы к распознаванию
  - Наборы данных
- Цели и задачи настоящей работы
Метод полуконтролируемого обучения с автоматическим исправлением ошибок
- Предварительная обработка текста
- Построение выравнивания
  - Поиск регионов интереса. Хэширование
  - Оптимальное выравнивание. Алгоритм Нидлмана-Вунша
- Исправление ошибок после выравнивания
- Полуконтролируемое обучение
Собранные данные и разработанный программный продукт
- Полученный набор данных
- Программный продукт
Вычислительные эксперименты
- Предобработка данных и выравнивание
- Обучение нейронной сети
- Результаты полуконтролируемого обучения
- Анализ типичных ошибок распознавания
Заключение
Список использованных источников
Приложение 1. Дополнительные иллюстрации
Приложение 2. Результаты подсчёта числа заменах букв в выравнивании

Статистика использования

Количество обращений: 33
За последние 30 дней: 1
Подробная статистика

Детальная информация

Аннотация

Права на использование объекта хранения

Оглавление

Статистика использования