Details

Title Count time series analysis of jobs scheduling in the hybrid supercomputer center // Информатика, телекоммуникации и управление. – 2024. – Т. 17, № 3: Тематический сборник "Решение прикладных задач методами искусственного интеллекта". — С. 42-53
Creators Malov S. V. ; Lukashin A. A.
Imprint 2024
Collection Общая коллекция
Subjects Вычислительная техника ; Прикладные информационные (компьютерные) технологии в целом ; Математика ; Математическая статистика ; supercomputing centers ; hybrid supercomputer centers ; time series of frequencies ; discrete time series ; generalized equations ; autoregressive models ; poisson autoregressive models ; суперкомпьютерные центры ; гибридные суперкомпьютерные центры ; временные ряды частот ; дискретные временные ряды ; обобщенные уравнения ; авторегрессионные модели ; пуассоновские авторегрессионные модели
UDC 519.22 ; 004.9
LBC 22.172 ; 32.973-018.2
Document type Article, report
File type PDF
Language English
DOI 10.18721/JCSTCS.17304
Rights Свободный доступ из сети Интернет (чтение, печать, копирование)
Record key RU\SPSTU\edoc\74888
Record create date 12/17/2024

Allowed Actions

Read Download (0.5 Mb)

Group Anonymous
Network Internet

Increasing the efficiency of supercomputer centers is an extremely important task, especially in the context of growing demand for high-performance computing and a shortage of supercomputer resources. Statistical analysis of the results of various indicators of supercomputer performance is aimed at creating models of computing resource management and forming a basis for using artificial intelligence methods. The purpose of this research is to study the incoming flow of user requests (jobs), which largely determines the load on supercomputer resources. To analyze the incoming flow of user jobs, generalized linear models and generalized estimating equations, as well as the autoregressive conditional Poisson model, were used. It allowed taking into account the dependence of observations and the effect of overdispersion. Based on the results of supercomputer operation observations, estimates of the time trend were obtained, as well as indicators of changes in the intensity of the job flow within weekly and annual cycles with classification by areas of expertise and computing clusters. Indicators of statistical significance of changes within the weekly and annual cycles were established. As a result of an advanced statistical analysis using multiple comparison methods, statistically significant orders of the main effects of the weekly and annual factors were obtained.

Повышение эффективности использования суперкомпьютерных центров является крайне важной задачей, особенно в условиях растущего спроса на высокопроизводительные вычисления и дефицит суперкомпьютерных ресурсов. Статистический анализ результатов различных показателей функционирования суперкомпьютера направлен на создание моделей управления вычислительными ресурсами и формирование базы для использования методов искусственного интеллекта. Целью данного исследования является изучение входящего потока заявок пользователей, во многом определяющего загрузку ресурсов суперкомпьютера. Для анализа входящего потока заявок пользователей используются обобщенные линейные модели и обобщенные уравнения оценивания, а также пуассоновская авторегрессионная модель, применение которых позволяет учитывать зависимость наблюдений и эффект избыточной дисперсии. По результатам наблюдений за работой суперкомпьютера получены оценки временного тренда, а также показатели изменений интенсивности потока заявок в рамках недельного и годового циклов с классификацией по областям знаний и вычислительным комплексам. Установлены показатели статистической значимости изменений в рамках недельного и годового цикла с учетом данной классификации. В результате углубленного анализа с использованием методов множественного сравнения получены статистически значимые порядки главных эффектов недельного и годового факторов.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet All

Access count: 73 
Last 30 days: 8

Detailed usage statistics