Оптимизация циклов светофорного регулирования методом обучения с подкреплением

Саленек, Иван Андреевич; Селиверстов, Ярослав Александрович; Селиверстов, Святослав Александрович; Носкова, Надежда Игоревна

Details

	Table	Card	RUSMARC

Title:	Оптимизация циклов светофорного регулирования методом обучения с подкреплением // Системный анализ в проектировании и управлении: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 года: [в 3 частях]. Ч. 1
Creators:	Саленек Иван Андреевич; Селиверстов Ярослав Александрович; Селиверстов Святослав Александрович; Носкова Надежда Игоревна
Organization:	Национальный исследовательский университет "Высшая школа экономики"; Российская академия наук. Институт проблем транспорта им. Н. С. Соломенко; Центр организации дорожного движения Правительства Москвы
Imprint:	Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2023
Collection:	Общая коллекция
Subjects:	Искусственный интеллект; Машинное обучение; обучение с подкреплением; светофорное управление; мультиагентные системы; интеллектуальные транспортные системы; reinforcement learning; traffic light control; multi-agent system; intelligent transportation system
UDC:	004.85
Document type:	Article, report
File type:	PDF
Language:	Russian
DOI:	10.18720/SPBPU/2/id23-70
Rights:	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key:	RU\SPSTU\edoc\70279

Allowed Actions: –

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Сегодня на многих перекрестках г. Москвы и других городов России установлены детекторы транспорта, которые в онлайн-режиме предоставляют данные о количестве и скорости проходящих мимо автомобилей. Сейчас эти данные используют преимущественно для статистики, или переключения между фиксированными фазами светофоров. В данной работе мы исследуем возможности применения обучения с подкреплением (RL) для разработки эффективной политики динамического управления светофорным объектом на основе данных, поступающих с онлайн-детекторов.

Today, at many intersections in Moscow and other Russian cities, traffic detectors are installed that provide online data on the number and speed of cars passing by. Now this data is mainly used for statistics, or switching between fixed phases of traffic lights. In this paper, we explore the possibility of using reinforcement learning (RL) to develop an effective policy for dynamic control of a traffic light object based on data from online detectors.

Document access rights

	Network		User group		Action
	ILC SPbPU Local Network		All
	Internet		Authorized users SPbPU
	Internet		Anonymous

Included in

"Системный анализ в проектировании и управлении", международная научно-практическая конференция (26; 2022; Санкт-Петербург). Системный анализ в проектировании и управлении: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 года: [в 3 частях]. Ч. 1 / Международная академия наук высшей школы, Санкт-Петербургское отделение [и др.]; [программный комитет конференции: Ю. С. Васильев (председатель) [и др.]; [ответственные редакторы В. Н. Волкова, Г. В. Горелова]. — Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2023. — 1 файл (14,8 Мб). — Загл. с титул. экрана. — Электронная версия печатной публикации 2023 г. — Ч. текста на англ. яз. — Доступ по паролю из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/i23-68.pdf>. — DOI 10.18720/SPBPU/2/i23-68. — Текст: электронный

Usage statistics

Access count: 1
Last 30 days: 0
Detailed usage statistics