Reinforcement learning for industrial manufacturing control system

Hanafi, M. Ya.; Shkodyrev, V. P.

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Reinforcement learning for industrial manufacturing control system // Информатика, телекоммуникации и управление. – 2021. – С. 60-69
Авторы:	Hanafi M. Ya.; Shkodyrev V. P.
Выходные сведения:	2021
Коллекция:	Общая коллекция
Тематика:	Вычислительная техника; Прикладные информационные (компьютерные) технологии в целом; industrial production management; industrial production; control systems; training for control systems; dynamic programming; control theory; machine learning; управление промышленным производством; промышленное производство; системы управления; обучение для систем управления; динамическое программирование; теория управления; машинное обучение
УДК:	004.9
ББК:	32.973-018.2
Тип документа:	Статья, доклад
Тип файла:	PDF
Язык:	Английский
DOI:	10.18721/JCSTCS.14106
Права доступа:	Свободный доступ из сети Интернет (чтение, печать, копирование)
Ключ записи:	RU\SPSTU\edoc\67032

Разрешенные действия: Прочитать Загрузить (0,7 Мб)

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

he problem posed is a very general case of optimal control of a dynamic, potentially stochastic, and partially observable system for which a model is not necessarily available. We analyze the disadvantages of classical approaches of the control theory and present a new modified numerical reinforcement learning rule of machine learning algorithm. Control theory is a field that has been studied for a very long time and which deals with the behavior of dynamic systems and how to influence it. Among the best-known examples are LQG (Linear Quadratic Gaussian) or PID (Proportional Integral Derivative) controllers. Most of the existing approaches presuppose (analytical) knowledge of the dynamic system, and one of the constraints is the need to be able to free oneself from a priori models. We focus on modified reinforcement learning approach to adaptive control policy as perspective area of control of complex dynamical system under uncertainty.

Поставленная задача представляет общий случай оптимального управления динамической, потенциально стохастической и частично наблюдаемой системой, для которой модель не обязательно доступна. В статье представлен анализ недостатков классических подходов теории управления и предлагается новый модифицированный алгоритм машинного обучения с подкреплением. Теория управления – область, которая изучалась очень долгое время и которая касается поведения динамических систем и того, как на нее влиять. Среди наиболее известных примеров – LQG (Линейно-квадратичное гауссовское управление) или ПИД-контроллеры. Большинство существующих подходов предполагают (аналитическое) знание динамической системы, и одним из ограничений является необходимость иметь возможность освободиться от априорных моделей. Мы концентрируем внимание на преимуществах использования моделей машинного обучения с подкреплением как перспективной стратегии управления сложными динамическими системами в условиях неопределенности.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Все

Входит в состав

Информатика, телекоммуникации и управление = Computing, Telecommunications and Control. — Санкт-Петербург: СПбПУ, 2020-. — Электрон. журнал. — Периодичность: 4 раза в год. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Текст: электронный

Информатика, телекоммуникации и управление = Computing, Telecommunications and Control. — Санкт-Петербург: СПбПУ, 2020-. Vol. 14, № 1, 2021. — 1 файл (6,58 Мб). — Свободный доступ из сети Интернет (чтение, печать, копирование). — <URL:http://elib.spbstu.ru/dl/2/j21-382.pdf>.

Статистика использования

Количество обращений: 226
За последние 30 дней: 10
Подробная статистика