Распознавание железнодорожного полотна в видеопотоке: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_02 «Математические методы анализа и визуализации данных»

Нахатович, Михаил Алексеевич

Details

Title	Распознавание железнодорожного полотна в видеопотоке: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_02 «Математические методы анализа и визуализации данных»
Creators	Нахатович Михаил Алексеевич
Scientific adviser	Беляев Сергей Юрьевич
Organization	Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint	Санкт-Петербург, 2022
Collection	Выпускные квалификационные работы; Общая коллекция
Subjects	Машинное обучение; Нейронные сети; Распознавание образов; семантическая сегментация; обработка видеопотока; semantic segmentation; video stream processing
UDC	004.85; 004.032.26; 004.93'1
Document type	Master graduation qualification work
File type	PDF
Language	Russian
Level of education	Master
Speciality code (FGOS)	01.04.02
Speciality group (FGOS)	010000 - Математика и механика
DOI	10.18720/SPBPU/3/2023/vr/vr23-511
Rights	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key	ru\spstu\vkr\20809
Record create date	4/3/2023

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

Тема выпускной квалификационной работы: «Распознавание железнодорожного полотна в видеопотоке». Данная работа посвящена исследованию архитектур нейронных сетей для сегментации объектов в видеопотоке. Целью данной работы является разработка архитектуры нейронной сети с использованием временной информации из видеопотока для улучшения распознавания железнодорожного полотна на удалении более 150 метров от локомотива, на котором установлена камера слежения. А также написание программы для потоковой обработки видео. Основа архитектуры нейронной сети и метод распознавания железнодорожного полотна были взяты из статьи «Railroad semantic segmentation on high-resolution images» 2020 года за авторством С. Беляева. Был проведён анализ нескольких архитектур нейронных сетей для сегментации объектов в видеопотоке с использованием разных методов для получения информации с предыдущих кадров. В результате было разработано несколько архитектур нейронных сетей для распознавания железнодорожного полотна в видеопотоке: с использованием оптического потока, с использованием модулей распространения внимания, с использованием модуля памяти. В данной работе описаны архитектуры нейронных сетей и сравнение точности описанных подходов с сегментацией каждого кадра независимо от предыдущих. По результатам проведённой работы можно судить об эффективности применения методов использования временной информации по сравнению с наивным применением модели семантической сегментации изображения покадровым способом.

The subject of the graduate qualification work is «Railroad recognition in the video stream». This work is devoted to the study of neural network architectures for segmentation of objects in the video stream. The purpose of this work is to develop a neural network architecture using temporal information from the video stream to improve segmentation of a railroad at the distance of more than 150 meters from the locomotive on which the tracking camera is installed and to write a program for streaming video processing. The basis of the neural network architecture and the railroad recognition method were taken from an article «Railroad semantic segmentation on high-resolution images» S. Belyaev, 2020. An analysis was made of several architectures of neural networks for a video semantic segmentation, using different methods to obtain information from previous frames. As a result, several neural network architectures have been developed to recognize the railroad in the video stream: with usage of optical flow, with usage of attention propagation modules, with usage of memory module. This paper describes the architectures of neural networks and compares the accuracy of the described approaches with the segmentation of each frame, regardless of the previous ones. According to the results of the work carried out, one can estimate the effectiveness of the methods of using temporal information in a comparison with naive application of an image semantic segmentation model in a frame-by-frame manner.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 4
Last 30 days: 0

Detailed usage statistics