Details
Title | Внедрение обучения с подкреплением для обеспечения безопасности персонала в автоматизированных средах: выпускная квалификационная работа магистра: направление 38.04.05 «Бизнес-информатика» ; образовательная программа 38.04.05_02 «Бизнес-инжиниринг (международная образовательная программа)» |
---|---|
Creators | Железняк Артём Юрьевич |
Scientific adviser | Ильяшенко Оксана Юрьевна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли |
Imprint | Санкт-Петербург, 2022 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | Машинное обучение; Автоматизация производства; безопасность персонала; обучение с подкреплением; personnel safety; reinforcement learning |
UDC | 004.85; 658.52 |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 38.04.05 |
Speciality group (FGOS) | 380000 - Экономика и управление |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-741 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Record key | ru\spstu\vkr\21230 |
Record create date | 4/5/2023 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Тема выпускной квалификационной работы магистра: «Внедрение обучения с подкреплением для обеспечения безопасности персонала в автоматизированных средах». Целью исследования явилась разработка практически применимого решения для улучшения безопасности персонала в автоматизированных средах. Исследование выполнялось на базе Особенностей современных рабочих процессов в автоматизированных средах и использовании современных технологий машинного обучения. Предмет ВКР: разработка решения по улучшенной навигации в автоматизированных средах на основе обучения с подкреплением.Методы исследования: сравнительный анализ, метод аналогий, моделирование, моделирование бизнес-процессов. Основные результаты исследования: - проведённое исследование показало необходимость улучшения безопасности в автоматизированных средах; - в работе был представлен результат практического применения современных технологий машинного обучения для создания алгоритма имеющего цель улучшить безопасность рабочих; - практическое применение предложенного решения в среде автоматизированного склада. Область применения результатов ВКР – ИТ-проекты в сфере складской логистики. Научной новизной исследования является применение современных технологий машинного обучения, связывающих создание цифровой среды, Actor-Critic структуры нейросети и использованием Proximal Policy Optimization для обеспечения стабильности эффективности модели. Выводы. Задачи ВКР решены, цель достигнута, определена область применения результатов.
Theme of the master's thesis: «Implementation of reinforcement learning to ensure personnel safety in automated environments». The purpose of the research is development of practically applicable solution for the improvement of the personnel safety in automated environments. The study was carried out on the basis of Features of modern work processes in automated environments and utilizing modern machine learning technologies. The subject of the thesis: development of a solution for advanced path-finding in automated environments based on reinforcement learning. Research methods: comparative analysis, analogy method, modeling, business process modeling. The main results of the study: - the conducted research has shown the need in safety improving in automated environments; - the paper presented the result of the practical application modern machine learning technologies for the creation of an algorithm with an aim to improve safety of the workers; - practical application of the proposed solution in the environment of an automated warehouse. Scope of results IT projects in the field of warehouse logistics. The scientific novelty of research is the application of modern technologies of machine learning, linking the creation of the digital environment, Actor-Critic neural network structure and use of Proximal Policy Optimization to ensure stability of the efficiency of the model. Conclusions. The tasks of the thesis have been solved, the goal has been achieved, the scope of the results has been determined.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 9
Last 30 days: 0