Details
Title | Разработка многослойной схемы семантического кодирования видепотока: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_15 «Технологии проектирования системного и прикладного программного обеспечения» |
---|---|
Creators | Кобыжев Александр Михайлович |
Scientific adviser | Болсуновская Марина Владимировна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2024 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | кодирование видеопотока; кодирование особенностей изображений; глубокое обучение; машинная аналитика; кодирование видео для машин; нейросетевые кодеки; многослойные схемы кодирования; video coding; image feature coding; deep learning; machine analytics; video coding for machines; neural network codecs; multilayer coding schemes |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.01 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-3917 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\33136 |
Record create date | 8/29/2024 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена реализации многослойной схемы семантического кодирования видеопотока для сцен дорожного видеонаблюдения, а также оценке эффективности её работы. Проведён анализ существующих подходов к сжатию изображений и видео, сформулированы требования к схеме кодирования для решения поставленной задачи. Представлено описание разработанной многослойной схемы кодирования видеопотока и функции потерь для обучения нейросетевого кодека. Также разработана программная реализация обучения нейросетевого кодека, предложенной схемы кодирования и тестирования кодеков для сжатия видео на языке Python. По результатам тестирования схемы кодирования даны оценки эффективности сжатия для задач детектирования и распознавания, а также выбраны оптимальные параметры нейросетевого кодека.
This work is devoted to the realization of a multilayer semantic coding scheme for video stream for road surveillance scenes, as well as to the evaluation of its efficiency. The existing approaches to image and video compression are analyzed, and the requirements to the coding scheme for solving the problem are formulated. The description of the developed multilayer video stream coding scheme and loss function for neural network codec training is presented. Also, the program realization of training of neural network codec, the proposed coding scheme and testing of codecs for video compression in Python language is developed. Based on the results of testing the coding scheme, the compression efficiency for detection and recognition tasks is evaluated, and the optimal parameters of the neural network codec are selected.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0