Details

Title: Оптимизация циклов светофорного регулирования методом обучения с подкреплением // Системный анализ в проектировании и управлении: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 года: [в 3 частях]. Ч. 1
Creators: Саленек Иван Андреевич; Селиверстов Ярослав Александрович; Селиверстов Святослав Александрович; Носкова Надежда Игоревна
Organization: Национальный исследовательский университет "Высшая школа экономики"; Российская академия наук. Институт проблем транспорта им. Н. С. Соломенко; Центр организации дорожного движения Правительства Москвы
Imprint: Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2023
Collection: Общая коллекция
Subjects: Искусственный интеллект; Машинное обучение; обучение с подкреплением; светофорное управление; мультиагентные системы; интеллектуальные транспортные системы; reinforcement learning; traffic light control; multi-agent system; intelligent transportation system
UDC: 004.85
Document type: Article, report
File type: PDF
Language: Russian
DOI: 10.18720/SPBPU/2/id23-70
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\70279

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Сегодня на многих перекрестках г. Москвы и других городов России установлены детекторы транспорта, которые в онлайн-режиме предоставляют данные о количестве и скорости проходящих мимо автомобилей. Сейчас эти данные используют преимущественно для статистики, или переключения между фиксированными фазами светофоров. В данной работе мы исследуем возможности применения обучения с подкреплением (RL) для разработки эффективной политики динамического управления светофорным объектом на основе данных, поступающих с онлайн-детекторов.

Today, at many intersections in Moscow and other Russian cities, traffic detectors are installed that provide online data on the number and speed of cars passing by. Now this data is mainly used for statistics, or switching between fixed phases of traffic lights. In this paper, we explore the possibility of using reinforcement learning (RL) to develop an effective policy for dynamic control of a traffic light object based on data from online detectors.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 1
Last 30 days: 0
Detailed usage statistics