Детальная информация
| Название | Управление мобильным роботом на базе алгоритма TD3 с оценкой вероятностного представления состояния для частично наблюдаемой окружающей среды // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов |
|---|---|
| Авторы | Бархум Мажд ; Живицкий Андрей Юрьевич ; Борисов Олег Игоревич ; Пыркин Антон Александрович |
| Организация | Национальный исследовательский университет ИТМО |
| Выходные сведения | Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025 |
| Коллекция | Общая коллекция |
| Тип документа | Статья, доклад |
| Язык | Русский |
| DOI | 10.18720/SPBPU/2/id25-533 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | RU\SPSTU\edoc\77863 |
| Дата создания записи | 23.12.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
Работа посвящена проблеме навигации мобильных роботов в частично наблюдаемых средах, где неопределенность состояния существенно влияет на производительность. Мы предлагаем новый подход, сочетающий алгоритм обучения с подкреплением Twin Delayed Deep Deterministic Policy Gradient (TD3) с оценкой вероятностного представления состояния. Эта интегрированная структура обеспечивает автономную навигацию в сложных средах за счет учета неопределенности состояния. Результаты моделирования демонстрируют повышенную эффективность по сравнению с исходным алгоритмом TD3.
This work addresses the challenge of mobile robot navigation in partially observable environments, where state uncertainty significantly impacts performance. We propose a novel approach combining Twin Delayed Deep Deterministic Policy Gradient (TD3) reinforcement learning algorithm with explicit belief state estimation. This integrated framework enables autonomous navigation in complex environments by explicitly accounting for state uncertainty. Simulation results demonstrate improvements compared to the original Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0