Управление мобильным роботом на базе алгоритма TD3 с оценкой вероятностного представления состояния для частично наблюдаемой окружающей среды

Бархум Мажд; Живицкий, Андрей Юрьевич; Борисов, Олег Игоревич; Пыркин, Антон Александрович

Детальная информация

Название	Управление мобильным роботом на базе алгоритма TD3 с оценкой вероятностного представления состояния для частично наблюдаемой окружающей среды // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов
Авторы	Бархум Мажд ; Живицкий Андрей Юрьевич ; Борисов Олег Игоревич ; Пыркин Антон Александрович
Организация	Национальный исследовательский университет ИТМО
Выходные сведения	Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025
Коллекция	Общая коллекция
Тип документа	Статья, доклад
Язык	Русский
DOI	10.18720/SPBPU/2/id25-533
Права доступа	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно	Новинка
Ключ записи	RU\SPSTU\edoc\77863
Дата создания записи	23.12.2025

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

Работа посвящена проблеме навигации мобильных роботов в частично наблюдаемых средах, где неопределенность состояния существенно влияет на производительность. Мы предлагаем новый подход, сочетающий алгоритм обучения с подкреплением Twin Delayed Deep Deterministic Policy Gradient (TD3) с оценкой вероятностного представления состояния. Эта интегрированная структура обеспечивает автономную навигацию в сложных средах за счет учета неопределенности состояния. Результаты моделирования демонстрируют повышенную эффективность по сравнению с исходным алгоритмом TD3.

This work addresses the challenge of mobile robot navigation in partially observable environments, where state uncertainty significantly impacts performance. We propose a novel approach combining Twin Delayed Deep Deterministic Policy Gradient (TD3) reinforcement learning algorithm with explicit belief state estimation. This integrated framework enables autonomous navigation in complex environments by explicitly accounting for state uncertainty. Simulation results demonstrate improvements compared to the original Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

"Промышленный искусственный интеллект (ПИИ'2025)", всероссийская научно-практическая конференция (2025; Санкт-Петербург). Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов / Российская академия наук, Санкт-Петербургское отделение, Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербургский государственный университет; под общей редакцией Д. Г. Арсеньева. — Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025. — 1 файл (197 Мб Мб). — Загл. с титул. экрана. — Ч. текста парал. на рус. и англ. яз. — Электронная копия печатной публикации 2025 г. — Доступ по паролю из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/i25-310.pdf>. — DOI 10.18720/SPBPU/2/i25-310. — Текст: электронный

Количество обращений: 0
За последние 30 дней: 0

Подробная статистика