Детальная информация
| Название | Categorical survival analysis of the required job execution times in the hybrid supercomputer center // Информатика, телекоммуникации и управление. – 2025. – Т. 18, № 2. — С. 7-20 |
|---|---|
| Авторы | Misharina T. A. ; Malov S. V. |
| Выходные сведения | 2025 |
| Коллекция | Общая коллекция |
| Тематика | Математика ; Математическая статистика ; survival analysis (statistics) ; statistical methods ; Kaplan-Meier estimates ; estimates Kaplan-Meier ; supercomputer clusters ; statistical analyzes ; machine learning methods ; анализ выживаемости (статистика) ; статистические методы ; оценки Каплана-Мейера ; Каплана-Мейера оценки ; суперкомпьютерные кластеры ; статистические анализы ; методы машинного обучения |
| УДК | 519.22 |
| ББК | 22.172 |
| Тип документа | Статья, доклад |
| Тип файла | |
| Язык | Английский |
| DOI | 10.18721/JCSTCS.18201 |
| Права доступа | Свободный доступ из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | RU\SPSTU\edoc\77148 |
| Дата создания записи | 15.10.2025 |
According to statistics, the actual execution time of most jobs on a supercomputer cluster differs significantly from the time requested by the user. Investigation of distributions of supercomputer job execution times using statistical or machine learning methods allows optimizing the operation of a supercomputer cluster. We study the results of computational jobs processing in the supercomputer center of Peter the Great St. Petersburg Polytechnic University. We have developed a nonparametric approach for detection and statistical confirmation of weak stochastic orders based on categorical nonparametric framework of contrasts obtained from the Kaplan-Meier estimators obtained from independent groups of right-censored observations. To adjust the confidence level of the detected weak stochastic orders, we apply the Bonferroni correction to all the comparisons under consideration. We perform comparative statistical analysis of the distributions of required execution times to complete successfully the job in different groups of right-censored observations; detect and confirm available weak stochastic orders.
Согласно статистике, фактическое время выполнения большинства заданий на суперкомпьютерном кластере существенно отличается от времени, запрошенного пользователем. Исследование распределений времен исполнения задач на суперкомпьютере с использованием статистических методов или методов машинного обучения позволяет оптимизировать работу суперкомпьютерного кластера. Мы изучаем результаты исполнения вычислительных задач в суперкомпьютерном центре Санкт-Петербургского Политехнического университета Петра Великого. Нами разработан непараметрический подход для обнаружения и подтверждения статистической достоверности слабых стохастических порядков. Данный подход основан на категориальном непараметрическом методе сравнений на базе оценок Каплана-Мейера, построенных по независимым группам цензурированных справа наблюдений. Для корректировки уровня достоверности обнаруженных слабых стохастических порядков мы применяем поправку Бонферрони на все рассматриваемые сравнения. Проведен сравнительный статистический анализ распределений времен, необходимых для корректного завершения задач, в различных группах наблюдений, найдены и статистически подтверждены некоторые слабые стохастические порядки.
Количество обращений: 27
За последние 30 дней: 27