Details

Валиуллин, Александр Сергеевич. Исследование применений глубокого обучения в задаче распознавания картин [Электронный ресурс] = Research of deep learning applications in the problem of art painting recognition: выпускная квалификационная работа магистра: 09.04.04 - Программная инженерия ; 09.04.04_01 - Технология разработки и сопровождения качественного программного продукта / А. С. Валиуллин; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. П. Д. Дробинцев. — Электрон. текстовые дан. (1 файл : 12,9 Мб). — Санкт-Петербург, 2019. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/vr19-900.pdf>. — <URL:http://doi.org/10.18720/SPBPU/3/2019/vr/vr19-900>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-900-o.pdf>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-900-r.pdf>.

Record create date: 9/26/2019

Subject: Нейронные сети; Машинная графика; Распознавание образов; компьютерное зрение; дополненная реальность; глубокое обучение; сверточные нейронные сети; семантическая сегментация; обучение представлений

UDC: 004.93'1(043.3)

Collections: Выпускные квалификационные работы; Общая коллекция

Links: DOI; Отзыв руководителя; Рецензия

Allowed Actions: Read You need Flash Player to read document

Group: Anonymous

Network: Internet

Annotation

В данной работе рассматриваются возможности применения глубокого обучения в создании системы дополненной реальности. Данная система позволит посетителям музеев получить всю интересующую их информацию об экспонатах самостоятельно и в удобном виде с помощью смартфона. Цель работы: создание системы распознавания картины по её фотографии с применением алгоритмов глубокого обучения. Для достижения цели необходимо решить две проблемы: выделение картины из фотографии и её идентификация. Первая проблема решается обучением полностью сверточной нейронной сети для задачи семантической сегментации изображения. Полученная модель очень точно выделяет картины на фотографии и может работать на общедоступных мобильных устройствах, таких как смартфон и планшет. Вторая проблема решается обучением сверточной нейронной сети для генерации компактного представления изображения. Идентификация картины по данным представлениям требует мало вычислительных ресурсов и, следовательно, может работать непосредственно на мобильных устройствах. Система правильно распознает около 61% картин на датасете картин из Эрмитажа, выдавая для неправильно распознанных случаев картины того же автора, жанра и стиля, что также является положительным результатом. В работе использовались как и методы глубокого обучения (с помощью библиотеки PyTorch), так и методы классического компьютерного зрения (с помощью библиотек OpenCV и SkImage).

In this work we consider the possibility of using deep learning in the creation of a museum augmented reality system. This system will allow museum’s visitors to get all information they want about the exhibits on their own and in desired form using their smartphones. The aim of this work is to create a painting recognition system using deep learning algorithms. To achieve this goal, it is necessary to solve two problems: extraction of a painting from it’s photo and painting identification. The first problem is solved by training a fully convolutional neural network for the problem of semantic image segmentation. The resulting model very accurately extracts painting from photo and can work on widely available mobile devices such as smartphones and tablets. The second problem is solved by training a convolution neural network to generate a compact representation of the image. Identifying painting on the photo using this representations requires little computing power and thus can work directly on mobile devices. The system correctly recognizes about 61% of the paintings in Hermitage paintings dataset. In incorrect cases system identifies painting as other painting of the same author, genre and style. This is also a good result. In this work we used both deep learning methods (using the PyTorch library) and classical computer vision methods (using the OpenCV and SkImage libraries).

Document access rights

Network User group Action
FL SPbPU Local Network All Read
-> Internet All Read

Table of Contents

  • Введение
    • Актуальность
    • Цели и задачи
  • Обзор существующих решений
    • Обзор работ по распознаванию картин
    • Структура будущего решения
  • Алгоритмы глубокого обучения
    • Сверточные сети
    • Обнаружение объектов
      • Classification + Localization
      • Object Detection
      • Instance Segmentation
      • Semantic Segmentation
    • Обучение представлений
      • Классификационные функции потерь
      • Попарные функции потерь (Pairwise losses)
      • Триплетные функции потерь (Triplet losses)
      • Квадруплетные функции потерь (Quadruplet losses)
      • Гистограммная функция потерь (Histogram loss)
    • Обучение глубоких нейронных сетей
      • Предобработка данных
      • Инициализация весов модели
      • Batch Normalization
      • Dropout
  • Модели глубокого обучения
    • Обучение нейронных сетей
    • Модуль для выделения картины из фотографии
      • Набор данных
      • Архитектуры нейронных сетей
      • Обучение нейронных сетей
      • Пост-обработка и выделение картины
    • Модуль идентификации картины
      • Набор данных
      • Функции потерь для задачи обучения представления
      • Архитектуры нейронных сетей
      • Способы поиска ближайшего дескриптора
      • Метрики качества
      • Эксперименты и результаты
  • Заключение
  • Список литературы

Document usage statistics

stat Document access count: 10
Last 30 days: 5
Detailed usage statistics