Details
Title | Распознавание объектов в видеопоследовательности с камеры БПЛА при помощи нейронной сети CLIP: выпускная квалификационная работа магистра: направление 15.04.06 «Мехатроника и робототехника» ; образовательная программа 15.04.06_04 «Робототехника» |
---|---|
Creators | Билицкий Владислав Валерьевич |
Scientific adviser | Станкевич Лев Александрович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт машиностроения, материалов и транспорта |
Imprint | Санкт-Петербург, 2024 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | БПЛА; машинное обучение; CLIP; набор данных; метрики качества; UAV; machine learning; dataset; quality metrics |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 15.04.06 |
Speciality group (FGOS) | 150000 - Машиностроение |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-6254 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\33012 |
Record create date | 8/28/2024 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Целью работы является разработка алгоритма по сопровождению объекта интереса с использованием модели CLIP. Задачей алгоритма является достоверное распознавание описанного при помощи текста объекта и дальнейшее его сопровождение. Был проведён поиск наборов данных, которые содержат видеопоследовательности, снятые с БПЛА. В работе разработаны и исследованы различные модели и алгоритмы, разработанные для отслеживания объекта. Произведён анализ модели CLIP, разобран используемый набор данных, а также реализованы подходящие метрики для определения качества разработанного алгоритма. Приведены примеры работы алгоритма, с подробным описанием каждого шага.
The goal of the work is to develop an algorithm for tracking an object of interest using the CLIP model. The task of the algorithm is to reliably recognize an object described using text and further track it. A search was conducted for datasets that contain video sequences taken from UAVs. The work developed and investigated various models and algorithms designed for object tracking. An analysis of the CLIP model was performed, the dataset used was disassembled, and appropriate metrics were implemented to determine the quality of the developed algorithm. Examples of the algorithms work are given, with a detailed description of each step.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 1
Last 30 days: 0