Details

Title: Исследование и разработка методов создания цифровой копии документа при помощи камеры: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_20 «Проектирование интеллектуальных компьютерных систем»
Creators: Истомин Валерий Ильич
Scientific adviser: Перезябов Олег Аркадьевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: цифровая копия документа; восстановление топологии изображения; интерполяция; аппроксимация; полином; OCR-системы; перспективные преобразования; фильтрация; digital document copy; image topology recovery; interpolation; approximation; polynomial; OCR systems; perspective transformation; filtering
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3879
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\25009

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Работа посвящена исследованию и разработке метода восстановления топологии цифрового изображения твердой копии документа, полученного при помощи камер. Работа состоит из трех основных разделов. В рамках первого раздела проводится обзор и анализ существующих методов и алгоритмов, применяемых для создания цифровых копий документов и восстановления топологии их изображений. Оценка работы данных алгоритмов позволяет выявить особенности и недостатки существующих методов восстановления геометрии документов. Во втором разделе работы исследуются различные подходы к детектированию и сегментации документов на изображении, с целью выбора оптимального алгоритма для решения поставленной задачи. Помимо этого, разрабатывается алгоритм, основанный на методах компьютерного зрения, использующий перспективное преобразование и методы аппроксимации, линейной и кубической интерполяции. Третий раздел работы посвящен оценке качества и точности разработанного метода восстановления геометрии изображения документа, а также его сравнению с существующими решениями. На основе проведенного исследования и полученных результатов делается вывод о применимости разработанного алгоритма для решения задачи восстановления топологии изображения документа в цифровой форме.

The work is dedicated to the investigation and development of a method for recovering the topology of a digital image of a hard copy document obtained using a camera. The work consists of three main sections. The first section includes a review and analysis of existing methods and algorithms used for creating digital document copies and recovering the topology of their images. Evaluating the performance of these algorithms allows identifying the features and shortcomings of existing document geometry recovery methods. The second section of the work explores various approaches to document detection and segmentation in images, aiming to select the optimal algorithm for solving the given task. Additionally, an algorithm based on computer vision methods is developed, utilizing perspective transformation and methods of approximation, linear, and cubic interpolation. The third section of the work is dedicated to evaluating the quality and accuracy of the developed method for image document geometry recovery, as well as comparing it with existing solutions. Based on the conducted research and obtained results, a conclusion is drawn regarding the applicability of the developed algorithm for solving the task of recovering the topology of a document image in digital form.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • 1. ОБЗОР СУЩЕСТВУЮЩИХ РЕШЕНИЙ
    • 1.1. Анализ мобильных приложений для сканирования документов
    • 1.2. Алгоритм на основе перспективных преобразований
    • 1.3. Нейросетевые свёрточные алгоритмы с архитектурой кодер-декодер
      • 1.3.1. Обзор DocTr
      • 1.3.2. Практический анализ научной работы
  • 2. РАЗРАБОТКА АЛГОРИТМА ВОССТАНОВЛЕНИЯ ГЕОМЕТРИИ ДОКУМЕНТА
  • 2.1. Формализация требований к дальнейшей разработке алгоритма
  • 2.2. Задача поиска контура документа
    • 2.2.1. Алгоритмы на основе контурных перепадов
      • 2.2.2. Суперпиксельные алгоритмы
      • 2.2.3. Сравнение алгоритмов контурных перепадов и суперпиксельных алгоритмов
      • 2.2.4. Подготовка набора данных для нейросетевых подходов
      • 2.2.5. Теоретический анализ Mask R-CNN
      • 2.2.6. Теоретический анализ YOLOv8
      • 2.2.7. Практический анализ Mask R-CNN и YOLOv8
  • 2.3. Алгоритм восстановления геометрии документа
    • 2.3.1. Общее описание алгоритма
    • 2.3.2. Получение маски документа с помощью YOLO и поиск полинома
    • 2.3.3. Поиск рёбер документа и их интерполяция
    • 2.3.4. Построение сетки аппроксимации и её интерполяция
    • 2.3.5. Поиск пересечений линий интерполяции аппроксимации. Построение выровненной сетки и точек пересечения
    • 2.3.6. Переотображение от интерполяционной сетки к равномерной
  • 3. ТЕСТИРОВАНИЕ И ОЦЕНКА РЕЗУЛЬТАТОВ
    • 3.1. Описание метрик для анализа полученных результатов
    • 3.2. Использование OCR для создания метрики читабельности текста
      • 3.2.1. Обзор OCR-систем EasyOCR и Tesseract
      • 3.2.2. Оценка читабельности текста
    • 3.3. Оценка восстановления топологии документа
  • Приложение 1.
  • Поиск границ на изображении с помощью оператора Канни
  • Приложение 2.
  • Функция поиска маски документа на основе суперпиксельного алгоритма SLIC
  • Приложение 3.
  • Функция поиска маски документа на основе YOLOv8
  • Приложение 4.
  • Функция поиска полинома
  • Приложение 5.
  • Поиск координат сторон документа
  • Приложение 6.
  • Интерполяция координат противоположных сторон документа
  • Приложение 7.
  • Аппроксимация и интерполяция линий построенной сетки документа
  • Приложение 8.
  • Поиск координат пересечений между аппроксимированными линиями сетки
  • Приложение 9.
  • Переотображение от интерполяционной сетки к равномерной

Usage statistics

stat Access count: 2
Last 30 days: 2
Detailed usage statistics