Детальная информация

Название: Разработка системы распознавания возгораний по видеопотоку на основе сверточных нейронных сетей: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Авторы: Диаби Умар
Научный руководитель: Воинов Никита Владимирович
Другие авторы: Локшина Екатерина Геннадиевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: распознавание возгораний; видеопоток; свертка; depthwise separable convolution; нейронные сети; предобработка изображений; fire recognition; videostream; convolution; neural networks; image precessing
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 09.04.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-919
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Целью работы является разработка метода автоматического распознавания возгораний по видеопотоку на основе сверточных нейронных сетей. Работа содержит обзор существующих методов и алгоритмов в области компьютерного зрения, относящихся к задачам распознавания объектов, а также специализированных архитектур глубоких нейронных сетей для задач распознавания возгораний. Основной упор сделан на современных методах машинного обучения и сверточных нейронных сетях для понимания истории этого типа статистических моделей и недостатков применения некоторых из них в поставленной задаче. Далее предлагается архитектура для эффективного решения поставленной задачи. Оригинальность работы заключается в разработке модели сверточной нейронной сети, во-первых, обучающейся на относительно небольшом объеме данных, во-вторых, требующей меньших вычислительных мощностей по сравнению с другими моделями. Для достижения поставленной цели используется тип свертки, называемый "свертка по глубине" (англ. Depthwise separable convolution). Особенность данного типа свертки заключается в разделении процесса свертки на две части: depthwise convolution и pointwise convolution. Для обучения модели был построен датасет из 3040 изображений. Поскольку нейронные сети обычно обучаются на больших датасетах, в данной работе применяются методы увеличения данных, чтобы повысить точность модели. Также в работе представлены полученные результаты работы алгоритма, они сравниваются с результатами других подходов. На основе полученных результатов формулируются способы улучшения модели.

The goal of this thesis is to develop a method for automatic detection of fire from a video stream based on convolutional neural networks. Since a video is a sequence of images, in order to make predictions for a given video stream , we make a prediction for each image that is part of the video stream. We first explore the existing methods and algorithms in the field of computer vision related to object recognition problems, and then we move on to study specific architectures of deep neural networks for fire recognition tasks. More specifically, we start with a modern overview of machine learning methods and convolutional neural networks to understand the history of this type of statistical models, then we study the disadvantages of applying some of those methods in our current task, and then we propose our architecture for an effective solution of our given task. The originality of our work lies in the fact that we focus on developing a model of convolutional neural networks that is trained on a relatively small amount of data, on the one hand, and requires less computing power compared to other models on the other hand. To achieve this goal, we use a type of convolution called depthwise separate convolution. The particularity of this type of convolution is that it divides the convolution process into two parts: the first one is called depthwise convolution and the second one pointwise convolution. And for the training part of our model, we managed to build a small dataset of approximately 3040 images from Google images. Since neural networks are usually trained on large datasets, we use some data augmentation techniques to help our model more effectively generalize on new invisible data. Finally, we present the results of our algorithm, and then compare these results with the results of other approaches, and then we will suggest some ways to improve our model in the future.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 0
За последние 30 дней: 0
Подробная статистика