Details
Title | Распознавание железнодорожного полотна в видеопотоке: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_02 «Математические методы анализа и визуализации данных» |
---|---|
Creators | Нахатович Михаил Алексеевич |
Scientific adviser | Беляев Сергей Юрьевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2022 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | Машинное обучение; Нейронные сети; Распознавание образов; семантическая сегментация; обработка видеопотока; semantic segmentation; video stream processing |
UDC | 004.85; 004.032.26; 004.93'1 |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 01.04.02 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-511 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Record key | ru\spstu\vkr\20809 |
Record create date | 4/3/2023 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Тема выпускной квалификационной работы: «Распознавание железнодорожного полотна в видеопотоке». Данная работа посвящена исследованию архитектур нейронных сетей для сегментации объектов в видеопотоке. Целью данной работы является разработка архитектуры нейронной сети с использованием временной информации из видеопотока для улучшения распознавания железнодорожного полотна на удалении более 150 метров от локомотива, на котором установлена камера слежения. А также написание программы для потоковой обработки видео. Основа архитектуры нейронной сети и метод распознавания железнодорожного полотна были взяты из статьи «Railroad semantic segmentation on high-resolution images» 2020 года за авторством С. Беляева. Был проведён анализ нескольких архитектур нейронных сетей для сегментации объектов в видеопотоке с использованием разных методов для получения информации с предыдущих кадров. В результате было разработано несколько архитектур нейронных сетей для распознавания железнодорожного полотна в видеопотоке: с использованием оптического потока, с использованием модулей распространения внимания, с использованием модуля памяти. В данной работе описаны архитектуры нейронных сетей и сравнение точности описанных подходов с сегментацией каждого кадра независимо от предыдущих. По результатам проведённой работы можно судить об эффективности применения методов использования временной информации по сравнению с наивным применением модели семантической сегментации изображения покадровым способом.
The subject of the graduate qualification work is «Railroad recognition in the video stream». This work is devoted to the study of neural network architectures for segmentation of objects in the video stream. The purpose of this work is to develop a neural network architecture using temporal information from the video stream to improve segmentation of a railroad at the distance of more than 150 meters from the locomotive on which the tracking camera is installed and to write a program for streaming video processing. The basis of the neural network architecture and the railroad recognition method were taken from an article «Railroad semantic segmentation on high-resolution images» S. Belyaev, 2020. An analysis was made of several architectures of neural networks for a video semantic segmentation, using different methods to obtain information from previous frames. As a result, several neural network architectures have been developed to recognize the railroad in the video stream: with usage of optical flow, with usage of attention propagation modules, with usage of memory module. This paper describes the architectures of neural networks and compares the accuracy of the described approaches with the segmentation of each frame, regardless of the previous ones. According to the results of the work carried out, one can estimate the effectiveness of the methods of using temporal information in a comparison with naive application of an image semantic segmentation model in a frame-by-frame manner.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 4
Last 30 days: 0