Детальная информация

Название Управление мобильным роботом на базе алгоритма TD3 с оценкой вероятностного представления состояния для частично наблюдаемой окружающей среды // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов
Авторы Бархум Мажд ; Живицкий Андрей Юрьевич ; Борисов Олег Игоревич ; Пыркин Антон Александрович
Организация Национальный исследовательский университет ИТМО
Выходные сведения Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025
Коллекция Общая коллекция
Тип документа Статья, доклад
Язык Русский
DOI 10.18720/SPBPU/2/id25-533
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи RU\SPSTU\edoc\77863
Дата создания записи 23.12.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Работа посвящена проблеме навигации мобильных роботов в частично наблюдаемых средах, где неопределенность состояния существенно влияет на производительность. Мы предлагаем новый подход, сочетающий алгоритм обучения с подкреплением Twin Delayed Deep Deterministic Policy Gradient (TD3) с оценкой вероятностного представления состояния. Эта интегрированная структура обеспечивает автономную навигацию в сложных средах за счет учета неопределенности состояния. Результаты моделирования демонстрируют повышенную эффективность по сравнению с исходным алгоритмом TD3.

This work addresses the challenge of mobile robot navigation in partially observable environments, where state uncertainty significantly impacts performance. We propose a novel approach combining Twin Delayed Deep Deterministic Policy Gradient (TD3) reinforcement learning algorithm with explicit belief state estimation. This integrated framework enables autonomous navigation in complex environments by explicitly accounting for state uncertainty. Simulation results demonstrate improvements compared to the original Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика