Details

Title Reinforcement learning for industrial manufacturing control system // Информатика, телекоммуникации и управление. – 2021. – Vol. 14, № 1. — С. 60-69
Creators Hanafi M. Ya. ; Shkodyrev V. P.
Imprint 2021
Collection Общая коллекция
Subjects Вычислительная техника ; Прикладные информационные (компьютерные) технологии в целом ; industrial production management ; industrial production ; control systems ; training for control systems ; dynamic programming ; control theory ; machine learning ; управление промышленным производством ; промышленное производство ; системы управления ; обучение для систем управления ; динамическое программирование ; теория управления ; машинное обучение
UDC 004.9
LBC 32.973-018.2
Document type Article, report
File type PDF
Language English
DOI 10.18721/JCSTCS.14106
Rights Свободный доступ из сети Интернет (чтение, печать, копирование)
Record key RU\SPSTU\edoc\67032
Record create date 7/7/2021

Allowed Actions

Read Download (0.7 Mb)

Group Anonymous
Network Internet

he problem posed is a very general case of optimal control of a dynamic, potentially stochastic, and partially observable system for which a model is not necessarily available. We analyze the disadvantages of classical approaches of the control theory and present a new modified numerical reinforcement learning rule of machine learning algorithm. Control theory is a field that has been studied for a very long time and which deals with the behavior of dynamic systems and how to influence it. Among the best-known examples are LQG (Linear Quadratic Gaussian) or PID (Proportional Integral Derivative) controllers. Most of the existing approaches presuppose (analytical) knowledge of the dynamic system, and one of the constraints is the need to be able to free oneself from a priori models. We focus on modified reinforcement learning approach to adaptive control policy as perspective area of control of complex dynamical system under uncertainty.

Поставленная задача представляет общий случай оптимального управления динамической, потенциально стохастической и частично наблюдаемой системой, для которой модель не обязательно доступна. В статье представлен анализ недостатков классических подходов теории управления и предлагается новый модифицированный алгоритм машинного обучения с подкреплением. Теория управления – область, которая изучалась очень долгое время и которая касается поведения динамических систем и того, как на нее влиять. Среди наиболее известных примеров – LQG (Линейно-квадратичное гауссовское управление) или ПИД-контроллеры. Большинство существующих подходов предполагают (аналитическое) знание динамической системы, и одним из ограничений является необходимость иметь возможность освободиться от априорных моделей. Мы концентрируем внимание на преимуществах использования моделей машинного обучения с подкреплением как перспективной стратегии управления сложными динамическими системами в условиях неопределенности.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet All

Access count: 388 
Last 30 days: 22

Detailed usage statistics