Details

Title Development of a dual-loop method of intelligent traffic light control based on reinforcement learning and hourly distillation of phase trategies // Информатика, телекоммуникации и управление. – 2025. – Т. 18, № 3. — С. 144-153
Creators Sazanov A. M. ; Shkodyrev V. P. ; Ustinov S. M.
Imprint 2025
Collection Общая коллекция
Subjects Вычислительная техника ; Программирование ЭВМ. Компьютерные программы. Программотехника ; transport infrastructure ; Intelligent traffic light control ; dual-circuit control architecture ; traffic management ; reinforcement learning ; traffic light controllers ; транспортная инфраструктура ; интеллектуальное светофорное регулирование ; двухконтурная архитектура управления ; управление дорожным движением ; обучение с подкреплением ; интеллектуальное управление светофорами ; светофорные контроллеры
UDC 621.382
LBC 32.852
Document type Article, report
Language English
DOI 10.18721/JCSTCS.18313
Rights Свободный доступ из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key RU\SPSTU\edoc\78226
Record create date 2/6/2026

Allowed Actions

Read Download (0.5 Mb)

Group Anonymous
Network Internet

With increasingly complex urban dynamics, as well as increasing demands for the sustainability of urban mobility and introduction of cognitive technologies into transport infrastructure, the paper proposes a dual-loop method for intelligent traffic light control based on reinforcement learning and phase strategy distillation procedures. The first level implements real-time control through an RL-agent, while the second one generates backup hourly plans based on statistics of its behavior. The method is based on a system-discrete model taking into account stochastic traffic parameters and permissible control constraints. The simulation conducted in SUMO for a real intersection demonstrates a significant reduction in average transport delay compared to classical control, confirming the efficiency, sustainability and scalability of the approach. The obtained results substantiate the possibility of practical implementation of the model within the framework of intelligent transport systems of large cities and for laying the engineering foundation for hybrid urban mobility management architectures.

На фоне усложняющейся урбанистической динамики, а также возрастающих требований к устойчивости городской мобильности и внедрения когнитивных технологий в транспортную инфраструктуру в работе предлагается двухконтурный метод интеллектуального регулирования светофоров на основе обучения с подкреплением и процедур дистилляции фазовых стратегий. Первый уровень реализует управление в реальном времени через RL-агента, второй - формирует резервные почасовые планы на основе статистики его поведения. Метод опирается на системно-дискретную модель с учетом стохастических параметров трафика и допустимых ограничений управления. Проведенное моделирование в SUMO для реального перекрестка демонстрирует существенное снижение средней задержки транспорта по сравнению с классическим управлением, подтверждая эффективность, устойчивость и масштабируемость подхода. Полученные результаты обосновывают возможность практического внедрения модели в рамках интеллектуальных транспортных систем крупных городов и заложения инженерной основы для гибридных архитектур управления городской мобильностью.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet All

Access count: 28 
Last 30 days: 28

Detailed usage statistics