Details

Title Распознавание железнодорожного полотна в видеопотоке: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_02 «Математические методы анализа и визуализации данных»
Creators Нахатович Михаил Алексеевич
Scientific adviser Беляев Сергей Юрьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2022
Collection Выпускные квалификационные работы; Общая коллекция
Subjects Машинное обучение; Нейронные сети; Распознавание образов; семантическая сегментация; обработка видеопотока; semantic segmentation; video stream processing
UDC 004.85; 004.032.26; 004.93'1
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 01.04.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2023/vr/vr23-511
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key ru\spstu\vkr\20809
Record create date 4/3/2023

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Тема выпускной квалификационной работы: «Распознавание железнодорожного полотна в видеопотоке». Данная работа посвящена исследованию архитектур нейронных сетей для сегментации объектов в видеопотоке. Целью данной работы является разработка архитектуры нейронной сети с использованием временной информации из видеопотока для улучшения распознавания железнодорожного полотна на удалении более 150 метров от локомотива, на котором установлена камера слежения. А также написание программы для потоковой обработки видео. Основа архитектуры нейронной сети и метод распознавания железнодорожного полотна были взяты из статьи «Railroad semantic segmentation on high-resolution images» 2020 года за авторством С. Беляева. Был проведён анализ нескольких архитектур нейронных сетей для сегментации объектов в видеопотоке с использованием разных методов для получения информации с предыдущих кадров. В результате было разработано несколько архитектур нейронных сетей для распознавания железнодорожного полотна в видеопотоке: с использованием оптического потока, с использованием модулей распространения внимания, с использованием модуля памяти. В данной работе описаны архитектуры нейронных сетей и сравнение точности описанных подходов с сегментацией каждого кадра независимо от предыдущих. По результатам проведённой работы можно судить об эффективности применения методов использования временной информации по сравнению с наивным применением модели семантической сегментации изображения покадровым способом.

The subject of the graduate qualification work is «Railroad recognition in the video stream». This work is devoted to the study of neural network architectures for segmentation of objects in the video stream. The purpose of this work is to develop a neural network architecture using temporal information from the video stream to improve segmentation of a railroad at the distance of more than 150 meters from the locomotive on which the tracking camera is installed and to write a program for streaming video processing. The basis of the neural network architecture and the railroad recognition method were taken from an article «Railroad semantic segmentation on high-resolution images» S. Belyaev, 2020. An analysis was made of several architectures of neural networks for a video semantic segmentation, using different methods to obtain information from previous frames. As a result, several neural network architectures have been developed to recognize the railroad in the video stream: with usage of optical flow, with usage of attention propagation modules, with usage of memory module. This paper describes the architectures of neural networks and compares the accuracy of the described approaches with the segmentation of each frame, regardless of the previous ones. According to the results of the work carried out, one can estimate the effectiveness of the methods of using temporal information in a comparison with naive application of an image semantic segmentation model in a frame-by-frame manner.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 4 
Last 30 days: 0

Detailed usage statistics