Details

Title Разработка многослойной схемы семантического кодирования видепотока: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_15 «Технологии проектирования системного и прикладного программного обеспечения»
Creators Кобыжев Александр Михайлович
Scientific adviser Болсуновская Марина Владимировна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects кодирование видеопотока; кодирование особенностей изображений; глубокое обучение; машинная аналитика; кодирование видео для машин; нейросетевые кодеки; многослойные схемы кодирования; video coding; image feature coding; deep learning; machine analytics; video coding for machines; neural network codecs; multilayer coding schemes
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.01
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-3917
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\33136
Record create date 8/29/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена реализации многослойной схемы семантического кодирования видеопотока для сцен дорожного видеонаблюдения, а также оценке эффективности её работы. Проведён анализ существующих подходов к сжатию изображений и видео, сформулированы требования к схеме кодирования для решения поставленной задачи. Представлено описание разработанной многослойной схемы кодирования видеопотока и функции потерь для обучения нейросетевого кодека. Также разработана программная реализация обучения нейросетевого кодека, предложенной схемы кодирования и тестирования кодеков для сжатия видео на языке Python. По результатам тестирования схемы кодирования даны оценки эффективности сжатия для задач детектирования и распознавания, а также выбраны оптимальные параметры нейросетевого кодека.

This work is devoted to the realization of a multilayer semantic coding scheme for video stream for road surveillance scenes, as well as to the evaluation of its efficiency. The existing approaches to image and video compression are analyzed, and the requirements to the coding scheme for solving the problem are formulated. The description of the developed multilayer video stream coding scheme and loss function for neural network codec training is presented. Also, the program realization of training of neural network codec, the proposed coding scheme and testing of codecs for video compression in Python language is developed. Based on the results of testing the coding scheme, the compression efficiency for detection and recognition tasks is evaluated, and the optimal parameters of the neural network codec are selected.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics