Разработка системы распознавания возгораний по видеопотоку на основе сверточных нейронных сетей: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»

Диаби, Умар

Details

Title	Разработка системы распознавания возгораний по видеопотоку на основе сверточных нейронных сетей: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Creators	Диаби Умар
Scientific adviser	Воинов Никита Владимирович
Other creators	Локшина Екатерина Геннадиевна
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint	Санкт-Петербург, 2020
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	распознавание возгораний ; видеопоток ; свертка ; depthwise separable convolution ; нейронные сети ; предобработка изображений ; fire recognition ; videostream ; convolution ; neural networks ; image precessing
Document type	Master graduation qualification work
Language	Russian
Level of education	Master
Speciality code (FGOS)	09.04.04
Speciality group (FGOS)	090000 - Информатика и вычислительная техника
Links	Отзыв руководителя ; Рецензия ; Отчет о проверке на объем и корректность внешних заимствований
DOI	10.18720/SPBPU/3/2020/vr/vr20-919
Rights	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key	ru\spstu\vkr\6472
Record create date	7/10/2020

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

Целью работы является разработка метода автоматического распознавания возгораний по видеопотоку на основе сверточных нейронных сетей. Работа содержит обзор существующих методов и алгоритмов в области компьютерного зрения, относящихся к задачам распознавания объектов, а также специализированных архитектур глубоких нейронных сетей для задач распознавания возгораний. Основной упор сделан на современных методах машинного обучения и сверточных нейронных сетях для понимания истории этого типа статистических моделей и недостатков применения некоторых из них в поставленной задаче. Далее предлагается архитектура для эффективного решения поставленной задачи. Оригинальность работы заключается в разработке модели сверточной нейронной сети, во-первых, обучающейся на относительно небольшом объеме данных, во-вторых, требующей меньших вычислительных мощностей по сравнению с другими моделями. Для достижения поставленной цели используется тип свертки, называемый "свертка по глубине" (англ. Depthwise separable convolution). Особенность данного типа свертки заключается в разделении процесса свертки на две части: depthwise convolution и pointwise convolution. Для обучения модели был построен датасет из 3040 изображений. Поскольку нейронные сети обычно обучаются на больших датасетах, в данной работе применяются методы увеличения данных, чтобы повысить точность модели. Также в работе представлены полученные результаты работы алгоритма, они сравниваются с результатами других подходов. На основе полученных результатов формулируются способы улучшения модели.

The goal of this thesis is to develop a method for automatic detection of fire from a video stream based on convolutional neural networks. Since a video is a sequence of images, in order to make predictions for a given video stream , we make a prediction for each image that is part of the video stream. We first explore the existing methods and algorithms in the field of computer vision related to object recognition problems, and then we move on to study specific architectures of deep neural networks for fire recognition tasks. More specifically, we start with a modern overview of machine learning methods and convolutional neural networks to understand the history of this type of statistical models, then we study the disadvantages of applying some of those methods in our current task, and then we propose our architecture for an effective solution of our given task. The originality of our work lies in the fact that we focus on developing a model of convolutional neural networks that is trained on a relatively small amount of data, on the one hand, and requires less computing power compared to other models on the other hand. To achieve this goal, we use a type of convolution called depthwise separate convolution. The particularity of this type of convolution is that it divides the convolution process into two parts: the first one is called depthwise convolution and the second one pointwise convolution. And for the training part of our model, we managed to build a small dataset of approximately 3040 images from Google images. Since neural networks are usually trained on large datasets, we use some data augmentation techniques to help our model more effectively generalize on new invisible data. Finally, we present the results of our algorithm, and then compare these results with the results of other approaches, and then we will suggest some ways to improve our model in the future.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 18
Last 30 days: 0

Detailed usage statistics