Оптимизация циклов светофорного регулирования методом обучения с подкреплением

Саленек, Иван Андреевич; Селиверстов, Ярослав Александрович; Селиверстов, Святослав Александрович; Носкова, Надежда Игоревна

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Оптимизация циклов светофорного регулирования методом обучения с подкреплением // Системный анализ в проектировании и управлении: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 года: [в 3 частях]. Ч. 1
Авторы:	Саленек Иван Андреевич; Селиверстов Ярослав Александрович; Селиверстов Святослав Александрович; Носкова Надежда Игоревна
Организация:	Национальный исследовательский университет "Высшая школа экономики"; Российская академия наук. Институт проблем транспорта им. Н. С. Соломенко; Центр организации дорожного движения Правительства Москвы
Выходные сведения:	Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2023
Коллекция:	Общая коллекция
Тематика:	Искусственный интеллект; Машинное обучение; обучение с подкреплением; светофорное управление; мультиагентные системы; интеллектуальные транспортные системы; reinforcement learning; traffic light control; multi-agent system; intelligent transportation system
УДК:	004.85
Тип документа:	Статья, доклад
Тип файла:	PDF
Язык:	Русский
DOI:	10.18720/SPBPU/2/id23-70
Права доступа:	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи:	RU\SPSTU\edoc\70279

Разрешенные действия: –

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Сегодня на многих перекрестках г. Москвы и других городов России установлены детекторы транспорта, которые в онлайн-режиме предоставляют данные о количестве и скорости проходящих мимо автомобилей. Сейчас эти данные используют преимущественно для статистики, или переключения между фиксированными фазами светофоров. В данной работе мы исследуем возможности применения обучения с подкреплением (RL) для разработки эффективной политики динамического управления светофорным объектом на основе данных, поступающих с онлайн-детекторов.

Today, at many intersections in Moscow and other Russian cities, traffic detectors are installed that provide online data on the number and speed of cars passing by. Now this data is mainly used for statistics, or switching between fixed phases of traffic lights. In this paper, we explore the possibility of using reinforcement learning (RL) to develop an effective policy for dynamic control of a traffic light object based on data from online detectors.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Авторизованные пользователи СПбПУ
	Интернет		Анонимные пользователи

Входит в состав

"Системный анализ в проектировании и управлении", международная научно-практическая конференция (26; 2022; Санкт-Петербург). Системный анализ в проектировании и управлении: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 года: [в 3 частях]. Ч. 1 / Международная академия наук высшей школы, Санкт-Петербургское отделение [и др.]; [программный комитет конференции: Ю. С. Васильев (председатель) [и др.]; [ответственные редакторы В. Н. Волкова, Г. В. Горелова]. — Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2023. — 1 файл (14,8 Мб). — Загл. с титул. экрана. — Электронная версия печатной публикации 2023 г. — Ч. текста на англ. яз. — Доступ по паролю из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/i23-68.pdf>. — DOI 10.18720/SPBPU/2/i23-68. — Текст: электронный

Статистика использования

Количество обращений: 1
За последние 30 дней: 0
Подробная статистика