Details

Title Predictive models and dynamics of estimates of applied tasks characteristics using machine learning methods // Информатика, телекоммуникации и управление. – 2024. – Т. 17, № 3: Тематический сборник "Решение прикладных задач методами искусственного интеллекта". — С. 54-60
Creators Konstantinov A. V.
Imprint 2024
Collection Общая коллекция
Subjects Вычислительная техника ; Прикладные информационные (компьютерные) технологии в целом ; Программирование ЭВМ. Компьютерные программы. Программотехника ; machine learning ; machine learning methods ; prediction models (computing) ; survival analysis (computing) ; random survival forest (computing) ; Beran estimation ; estimation Beran ; машинное обучение ; методы машинного обучения ; модели предсказания (вычислительная техника) ; анализ выживаемости (вычислительная техника) ; случайный лес выживаемости (вычислительная техника) ; оценка Берана ; Берана оценка
UDC 004.9 ; 004.41/42
LBC 32.973-018.2 ; 32.973-018
Document type Article, report
File type PDF
Language English
DOI 10.18721/JCSTCS.17305
Rights Свободный доступ из сети Интернет (чтение, печать, копирование)
Record key RU\SPSTU\edoc\74889
Record create date 12/17/2024

Allowed Actions

Read Download (0.4 Mb)

Group Anonymous
Network Internet

The paper considers the machine learning problem of simultaneous estimation of the conditional survival distribution and dynamic characteristics of computational tasks. The problem arises in cluster workload management and is extremely relevant for optimal scheduling. To solve the problem, a new method is proposed, based on the combination of the attention mechanism and the random survival forest. The key feature is the use of a tree structure derived from a random survival forest. The forest construction algorithm uses only the survival dataset. Each leaf uses the unconditional Kaplan-Meier estimate, which is a serious limitation of the forest, especially for rare events in some parts of the feature space. Moreover, the random survival forest does not allow estimating the dynamic parameters of the task. The proposed method solves these problems by extending the already constructed random survival forest with the attention mechanism inside each leaf of the tree. The Beran estimator is used to model survival distribution, and the Nadaraya-Watson regression with the same parameters is used to predict the dynamic characteristics of tasks. To do this, subsets of training data corresponding to the same leaf as the input vector are used. As a result, the joint model is obtained that allows us to estimate the survival function more accurately and at the same time to predict the dynamic characteristics of the task. The developed model combines the advantages of smooth models based on the attention mechanism and stepwise decision trees.

В статье рассматривается задача машинного обучения, заключающаяся в одновременной оценке условного распределения выживаемости и динамических характеристик вычислительных задач. Проблема возникает при управлении рабочей нагрузкой кластера, и крайне актуальна для оптимального планирования. Для решения задачи предложен новый метод, основанный на комбинации механизма внимания и случайном лесе выживаемости. Ключевой особенностью является использование древовидной структуры, полученной случайным лесом выживания. Алгоритм построения леса опирается только на данные задачи выживаемости. В каждом листе используется безусловная оценка Каплана-Мейера, что является серьезным ограничением леса, особенно в случае редких событий в некоторых частях пространства признаков. Более того, случайный лес выживаемости не позволяет оценить динамические параметры задачи. Предлагаемый метод решает данные проблемы, дополняя уже построенный случайный лес выживаемости механизмом внимания внутри каждого листа дерева. Для моделирования выживаемости применяется оценка Берана, а для предсказания динамических характеристик задач - регрессия Надарая-Ватсона с теми же параметрами. Для этого используются подмножества обучающих данных, соответствующие тому же листу, что и входной вектор. В результате получена совместная модель, позволяющая более точно оценить функцию выживаемости и одновременно предсказать динамические характеристики задачи. Разработанная модель сочетает в себе преимущества гладких моделей, основанных на механизме внимания, и ступенчатых деревьев решений.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet All

Access count: 85 
Last 30 days: 14

Detailed usage statistics