Details

Title: Роевой поиск динамических объектов в прибрежной зоне: выпускная квалификационная работа магистра: направление 15.04.03 «Прикладная механика» ; образовательная программа 15.04.03_04 «Технологии виртуального инжиниринга»
Creators: Богданов Юлиан Владимирович
Scientific adviser: Кузин Алексей Константинович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт машиностроения, материалов и транспорта
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: обучение с подкреплением; PPO; поисковая задача; групповой поиск; управляемые беспилотные катера; reinforcement learning; search task; group search; controlled unmanned boats
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 15.04.03
Speciality group (FGOS): 150000 - Машиностроение
DOI: 10.18720/SPBPU/3/2023/vr/vr23-5625
Rights: Доступ по паролю из сети Интернет (чтение, печать)
Record key: ru\spstu\vkr\25401

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Роевой поиск динамических объектов в прибрежной зоне». В данной работе были рассмотрены научные работы, посвященные задачам преследования и мониторинга области при использовании различных управляемых беспилотных аппаратов. В работе приведены основные понятия и принципы обучения с подкреплением, приведены математические основы методов градиента стратегии. В работе была разработана механическая модель на базе реально существующего управляемого беспилотного судна, которое используется в процессе обучения в численных симуляциях. Для обучения модели были подготовлены среда обучения и обучающийся агент. В ходе работы были проведены обучения агентов: обучение стандартного примера, обучение задачи в простой постановке и в более сложной. Результаты обучения были проанализированы. Было исследованы влияния изменения параметра обучения learning_rate на результаты обучения.

The topic of the current graduate qualification work is "Swarm search for dynamic objects in the coastal area" In this thesis, scientific papers dedicated to the tasks of pursuing and monitoring the area using various controlled unmanned vehicles were considered. The paper presents the basic concepts and principles of reinforcement learning as well as the mathematical foundations of the strategy gradient methods. During the research, a mechanical model based on a real-life controlled unmanned vessel, which is used in the training process in numerical simulations, was developed. To train the model, a learning environment and a learning agent were prepared. In the course of work, agents were trained, including training with a standard example, training with a task in a simple formulation and in a more complex one. Subsequently, the learning outcomes were analyzed and the effects of changing the learning parameter «learning_rate» on learning outcomes were investigated.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
Internet Authorized users SPbPU Read Print
-> Internet Anonymous

Usage statistics

stat Access count: 3
Last 30 days: 0
Detailed usage statistics