Детальная информация

Название Исследование и разработка алгоритмов имитационного обучения для реализации автономного поведения агента на примере видеоигровой среды: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Авторы Ярошевич Игорь Александрович
Научный руководитель Туральчук Константин Анатольевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика имитационное обучение ; машинное обучение ; обучение с подкреплением ; алгоритмы ; imitation learning ; machine learning ; reinforcement learning ; algorithms
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.03
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-463
Права доступа Доступ по паролю из сети Интернет (чтение, печать)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\34438
Дата создания записи 17.03.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Настоящая работа посвящена исследованию алгоритмов имитационного обучения для разработки автономного агента в симуляционной среде. В ходе исследования разработана программная реализация поэтапного процесса обучения агента с использованием алгоритма DAgger (Dataset Aggregation), а также представлен новый гибридный алгоритм, объединяющий подходы DAgger и GAIL (Generative Adversarial Imitation Learning). Предмет исследования: алгоритмы имитационного обучения и их применение в задачах управления агентами. Цель работы: разработка автономного агента на основе алгоритмов имитационного обучения для взаимодействия в видеоигровой среде. Методы и методология: анализ существующих алгоритмов, создание на их основе модифицированного алгоритма, разработка агента с использованием библиотек машинного обучения, тестирование на различных конфигурациях окружения, сравнительный анализ полученных результатов. Результаты: разработан автономный агент на основе имитационного обучения с применением сверточной нейронной сети, способный ориентироваться в сложной симуляционной среде. Область применения: автономные транспортные средства, робототехника, видеоигровая сфера. Выводы: предложенный алгоритм, основанный на комбинации DAgger и GAIL, позволяет ускорить процесс обучения агента за счет эффективного использования демонстраций эксперта. В сравнении с методами обучения с подкреплением, модель достигает сравнимых результатов при меньших вычислительных затратах и меньшем количестве итераций.

his study focuses on the exploration of imitation learning algorithms for developing an autonomous agent in a simulation environment. As part of the research, a step-by-step training process for an agent using the DAgger (Dataset Aggregation) algorithm was implemented, and a novel hybrid algorithm combining DAgger and GAIL (Generative Adversarial Imitation Learning) was proposed. Research subject: Imitation learning algorithms and their application in agent control tasks. Objective: Development of an autonomous agent based on imitation learning algorithms for interaction in a video game environment. Methods and methodology: Analysis of existing algorithms, development of a modified algorithm based on them, implementation of an agent using machine learning libraries, testing on various environment configurations, and comparative analysis of the obtained results. Results: An autonomous agent based on imitation learning with a convolutional neural network was developed, capable of navigating a complex simulation environment. Application areas: Autonomous transportation, robotics, video game industry. Conclusions: The proposed algorithm, based on a combination of DAgger and GAIL, accelerates the agent training process through efficient use of expert demonstrations. Compared to reinforcement learning methods, the model achieves comparable performance with lower computational costs and fewer iterations.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать
Интернет Анонимные пользователи
  • Исследование и разработка алгоритмов имитационного обучения для реализации автономного поведения агента на примере видеоигровой среды
    • Введение
    • 1. Имитационное обучение
    • 2. Алгоритмы имитационного обучения
    • 3. Реализация агента
    • 4. Тестирование и апробация моделей
    • Заключение
    • Список сокращений и условных обозначений
    • Список использованных источников
    • Приложение 1. Исходный код разработанной программы

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика