Детальная информация

Название Developing an adaptive Intelligence agent for game theory based on reinforcement learning: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_17 «Интеллектуальные системы (международная образовательная программа) / Intelligent Systems (International Educational Program)»
Авторы Санчес Гомес Йеисон Андрес
Научный руководитель Шкодырев Вячеслав Петрович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения Санкт-Петербург, 2023
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика Искусственный интеллект; Машинное обучение; Игр теория; обучение с подкреплением; Монте-Карло; q-обучение; актер-критик; reinforcement learning; monte carlo; q-learning; actor-critic
УДК 004.85; 519.83
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 09.04.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2023/vr/vr24-590
Права доступа Доступ по паролю из сети Интернет (чтение, печать)
Ключ записи ru\spstu\vkr\27464
Дата создания записи 15.04.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В этом исследовании изучается использование алгоритмов обучения с подкреплением для создания адаптивного агента искусственного интеллекта в видеоиграх, таких как игры-лабиринты. В исследовании сравниваются и анализируются шесть контроллеров: Монте-Карло, SARSA, SARSA(λ), Q-learning, REINFORCE и Actor-Critic. Исследование включает в себя обучение агента ИИ каждому контроллеру и оценку его производительности. Результаты показывают, что контроллеры имеют разную эффективность в игровой среде. Контроллер Монте-Карло превосходен в разведке, но может медленно сходиться. SARSA и SARSA(λ) обеспечивают баланс между разведкой и эксплуатацией, при этом SARSA(λ) предлагает трассы, пригодные для долгосрочного обучения. Qlearning достигает хороших результатов, изучая оптимальную политику посредством оценки ценности действия. REINFORCE использует градиенты политики и показывает многообещающие результаты в оптимизации политики. Актер-критик сочетает в себе методы, основанные на ценностях и политике, что приводит к эффективному обучению. Эти результаты имеют значение для разработки игр, проектирования агентов искусственного интеллекта и алгоритмов обучения с подкреплением. Адаптивный агент искусственного интеллекта, созданный с помощью этих контроллеров, может улучшить игровой процесс и усовершенствовать интеллектуальные игровые агенты. В заключение, это исследование подчеркивает сильные и слабые стороны различных контроллеров обучения с подкреплением в игре-лабиринте. Исследование дает представление о выборе подходящих алгоритмов на основе их характеристик и производительности, способствуя лучшему пониманию обучения с подкреплением и его применения при разработке адаптивных агентов ИИ.

This research investigates the use of reinforcement learning algorithms to create an adaptive AI agent in video games such as maze games. The study compares and analyzes six controllers: Monte Carlo, SARSA, SARSA(λ), Q-learning, REINFORCE, and Actor-Critic. The research involves training the AI agent with each controller and evaluating their performance. The results demonstrate that the controllers have varying effectiveness in a game environment. The Monte Carlo controller excels in exploration but may converge slowly. SARSA and SARSA(λ) strike a balance between exploration and exploitation, with SARSA(λ) offering eligibility traces for long-term learning. Qlearning achieves good results by learning an optimal policy through action-value estimation. REINFORCE utilizes policy gradients and shows promising performance in policy optimization. Actor-Critic combines value-based and policybased methods, leading to efficient learning. These findings have implications in game development, AI agent design, and reinforcement learning algorithms. The adaptive AI agent created with these controllers can improve gameplay experiences and advance intelligent gaming agents. In conclusion, this research highlights the strengths and weaknesses of different reinforcement learning controllers in a maze game. The research provides insights for selecting appropriate algorithms based on their characteristics and performance, contributing to a better understanding of reinforcement learning and its application in developing adaptive AI agents.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать
Интернет Анонимные пользователи

Количество обращений: 4 
За последние 30 дней: 0

Подробная статистика