Details

Title: Разработка системы распознавания возгораний по видеопотоку на основе сверточных нейронных сетей: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Creators: Диаби Умар
Scientific adviser: Воинов Никита Владимирович
Other creators: Локшина Екатерина Геннадиевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: распознавание возгораний; видеопоток; свертка; depthwise separable convolution; нейронные сети; предобработка изображений; fire recognition; videostream; convolution; neural networks; image precessing
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 09.04.04
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-919
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Целью работы является разработка метода автоматического распознавания возгораний по видеопотоку на основе сверточных нейронных сетей. Работа содержит обзор существующих методов и алгоритмов в области компьютерного зрения, относящихся к задачам распознавания объектов, а также специализированных архитектур глубоких нейронных сетей для задач распознавания возгораний. Основной упор сделан на современных методах машинного обучения и сверточных нейронных сетях для понимания истории этого типа статистических моделей и недостатков применения некоторых из них в поставленной задаче. Далее предлагается архитектура для эффективного решения поставленной задачи. Оригинальность работы заключается в разработке модели сверточной нейронной сети, во-первых, обучающейся на относительно небольшом объеме данных, во-вторых, требующей меньших вычислительных мощностей по сравнению с другими моделями. Для достижения поставленной цели используется тип свертки, называемый "свертка по глубине" (англ. Depthwise separable convolution). Особенность данного типа свертки заключается в разделении процесса свертки на две части: depthwise convolution и pointwise convolution. Для обучения модели был построен датасет из 3040 изображений. Поскольку нейронные сети обычно обучаются на больших датасетах, в данной работе применяются методы увеличения данных, чтобы повысить точность модели. Также в работе представлены полученные результаты работы алгоритма, они сравниваются с результатами других подходов. На основе полученных результатов формулируются способы улучшения модели.

The goal of this thesis is to develop a method for automatic detection of fire from a video stream based on convolutional neural networks. Since a video is a sequence of images, in order to make predictions for a given video stream , we make a prediction for each image that is part of the video stream. We first explore the existing methods and algorithms in the field of computer vision related to object recognition problems, and then we move on to study specific architectures of deep neural networks for fire recognition tasks. More specifically, we start with a modern overview of machine learning methods and convolutional neural networks to understand the history of this type of statistical models, then we study the disadvantages of applying some of those methods in our current task, and then we propose our architecture for an effective solution of our given task. The originality of our work lies in the fact that we focus on developing a model of convolutional neural networks that is trained on a relatively small amount of data, on the one hand, and requires less computing power compared to other models on the other hand. To achieve this goal, we use a type of convolution called depthwise separate convolution. The particularity of this type of convolution is that it divides the convolution process into two parts: the first one is called depthwise convolution and the second one pointwise convolution. And for the training part of our model, we managed to build a small dataset of approximately 3040 images from Google images. Since neural networks are usually trained on large datasets, we use some data augmentation techniques to help our model more effectively generalize on new invisible data. Finally, we present the results of our algorithm, and then compare these results with the results of other approaches, and then we will suggest some ways to improve our model in the future.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 1
Last 30 days: 1
Detailed usage statistics