Details

Title Распознавание объектов в видеопоследовательности с камеры БПЛА при помощи нейронной сети CLIP: выпускная квалификационная работа магистра: направление 15.04.06 «Мехатроника и робототехника» ; образовательная программа 15.04.06_04 «Робототехника»
Creators Билицкий Владислав Валерьевич
Scientific adviser Станкевич Лев Александрович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт машиностроения, материалов и транспорта
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects БПЛА; машинное обучение; CLIP; набор данных; метрики качества; UAV; machine learning; dataset; quality metrics
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 15.04.06
Speciality group (FGOS) 150000 - Машиностроение
DOI 10.18720/SPBPU/3/2024/vr/vr24-6254
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\33012
Record create date 8/28/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Целью работы является разработка алгоритма по сопровождению объекта интереса с использованием модели CLIP. Задачей алгоритма является достоверное распознавание описанного при помощи текста объекта и дальнейшее его сопровождение. Был проведён поиск наборов данных, которые содержат видеопоследовательности, снятые с БПЛА. В работе разработаны и исследованы различные модели и алгоритмы, разработанные для отслеживания объекта. Произведён анализ модели CLIP, разобран используемый набор данных, а также реализованы подходящие метрики для определения качества разработанного алгоритма. Приведены примеры работы алгоритма, с подробным описанием каждого шага.

The goal of the work is to develop an algorithm for tracking an object of interest using the CLIP model. The task of the algorithm is to reliably recognize an object described using text and further track it. A search was conducted for datasets that contain video sequences taken from UAVs. The work developed and investigated various models and algorithms designed for object tracking. An analysis of the CLIP model was performed, the dataset used was disassembled, and appropriate metrics were implemented to determine the quality of the developed algorithm. Examples of the algorithms work are given, with a detailed description of each step.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 1 
Last 30 days: 0

Detailed usage statistics