Детальная информация

Название: Исследование и разработка методов создания цифровой копии документа при помощи камеры: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_20 «Проектирование интеллектуальных компьютерных систем»
Авторы: Истомин Валерий Ильич
Научный руководитель: Перезябов Олег Аркадьевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2023
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: цифровая копия документа; восстановление топологии изображения; интерполяция; аппроксимация; полином; OCR-системы; перспективные преобразования; фильтрация; digital document copy; image topology recovery; interpolation; approximation; polynomial; OCR systems; perspective transformation; filtering
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3879
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\25009

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Работа посвящена исследованию и разработке метода восстановления топологии цифрового изображения твердой копии документа, полученного при помощи камер. Работа состоит из трех основных разделов. В рамках первого раздела проводится обзор и анализ существующих методов и алгоритмов, применяемых для создания цифровых копий документов и восстановления топологии их изображений. Оценка работы данных алгоритмов позволяет выявить особенности и недостатки существующих методов восстановления геометрии документов. Во втором разделе работы исследуются различные подходы к детектированию и сегментации документов на изображении, с целью выбора оптимального алгоритма для решения поставленной задачи. Помимо этого, разрабатывается алгоритм, основанный на методах компьютерного зрения, использующий перспективное преобразование и методы аппроксимации, линейной и кубической интерполяции. Третий раздел работы посвящен оценке качества и точности разработанного метода восстановления геометрии изображения документа, а также его сравнению с существующими решениями. На основе проведенного исследования и полученных результатов делается вывод о применимости разработанного алгоритма для решения задачи восстановления топологии изображения документа в цифровой форме.

The work is dedicated to the investigation and development of a method for recovering the topology of a digital image of a hard copy document obtained using a camera. The work consists of three main sections. The first section includes a review and analysis of existing methods and algorithms used for creating digital document copies and recovering the topology of their images. Evaluating the performance of these algorithms allows identifying the features and shortcomings of existing document geometry recovery methods. The second section of the work explores various approaches to document detection and segmentation in images, aiming to select the optimal algorithm for solving the given task. Additionally, an algorithm based on computer vision methods is developed, utilizing perspective transformation and methods of approximation, linear, and cubic interpolation. The third section of the work is dedicated to evaluating the quality and accuracy of the developed method for image document geometry recovery, as well as comparing it with existing solutions. Based on the conducted research and obtained results, a conclusion is drawn regarding the applicability of the developed algorithm for solving the task of recovering the topology of a document image in digital form.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • ВВЕДЕНИЕ
  • 1. ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ
    • 1.1. Анализ мобильных приложений для сканирования документов
    • 1.2. Алгоритм на основе перспективных преобразований
    • 1.3. Нейросетевые свёрточные алгоритмы с архитектурой кодер-декодер
      • 1.3.1. Обзор DocTr
      • 1.3.2. Практический анализ научной работы
  • 2. РАЗРАБОТКА АЛГОРИТМА ВОССТАНОВЛЕНИЯ ГЕОМЕТРИИ ДОКУМЕНТА
  • 2.1. Формализация требований к дальнейшей разработке алгоритма
  • 2.2. Задача поиска контура документа
    • 2.2.1. Алгоритмы на основе контурных перепадов
      • 2.2.2. Суперпиксельные алгоритмы
      • 2.2.3. Сравнение алгоритмов контурных перепадов и суперпиксельных алгоритмов
      • 2.2.4. Подготовка набора данных для нейросетевых подходов
      • 2.2.5. Теоретический анализ Mask R-CNN
      • 2.2.6. Теоретический анализ YOLOv8
      • 2.2.7. Практический анализ Mask R-CNN и YOLOv8
  • 2.3. Алгоритм восстановления геометрии документа
    • 2.3.1. Общее описание алгоритма
    • 2.3.2. Получение маски документа с помощью YOLO и поиск полинома
    • 2.3.3. Поиск рёбер документа и их интерполяция
    • 2.3.4. Построение сетки аппроксимации и её интерполяция
    • 2.3.5. Поиск пересечений линий интерполяции аппроксимации. Построение выровненной сетки и точек пересечения
    • 2.3.6. Переотображение от интерполяционной сетки к равномерной
  • 3. ТЕСТИРОВАНИЕ И ОЦЕНКА РЕЗУЛЬТАТОВ
    • 3.1. Описание метрик для анализа полученных результатов
    • 3.2. Использование OCR для создания метрики читабельности текста
      • 3.2.1. Обзор OCR-систем EasyOCR и Tesseract
      • 3.2.2. Оценка читабельности текста
    • 3.3. Оценка восстановления топологии документа
  • Приложение 1.
  • Поиск границ на изображении с помощью оператора Канни
  • Приложение 2.
  • Функция поиска маски документа на основе суперпиксельного алгоритма SLIC
  • Приложение 3.
  • Функция поиска маски документа на основе YOLOv8
  • Приложение 4.
  • Функция поиска полинома
  • Приложение 5.
  • Поиск координат сторон документа
  • Приложение 6.
  • Интерполяция координат противоположных сторон документа
  • Приложение 7.
  • Аппроксимация и интерполяция линий построенной сетки документа
  • Приложение 8.
  • Поиск координат пересечений между аппроксимированными линиями сетки
  • Приложение 9.
  • Переотображение от интерполяционной сетки к равномерной

Статистика использования

stat Количество обращений: 2
За последние 30 дней: 2
Подробная статистика