Details

Title Разработка и исследование ансамблевых моделей в рамках анализа выживаемости: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Creators Хомец Семен Павлович
Scientific adviser Уткин Лев Владимирович
Other creators Константинов А. В.
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects анализ выживаемости ; модель берана ; ансамблевые модели ; линейная оптимизация ; механизм внимания ; survival analysis ; berans model ; ensemble models ; linear optimisation ; attention mechanism
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 02.04.01
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2025/vr/vr25-4301
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\38927
Record create date 9/24/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

В машинном обучении для анализа выживаемости разработан ряд ансамблевых методов, включая случайные леса выживаемости, градиентный бустинг на основе слабых моделей и ансамбли моделей Кокса. В данной работе предложены две новые ансамблевая модель SurvBETA (Survival Beran Estimator Ensemble using Three Attention mechanisms) и SurvBESA (Survival Beran Estimator Ensemble using Self-Attention), расширяющие набор существующих подходов. В качестве базовых алгоритмов в ансамблях используются модели Берана, которые можно рассматривать как ядерные регрессионные модели, учитывающие зависимости между объектами. Предсказания слабых моделей в форме условных функций выживаемости объединяются посредством механизма внимания, вычисляемого на основе расстояния между различными объектами. Особенностью SurvBETA является тройное применение механизма внимания: при построении моделей Берана, при определении прототипов бутстреп-выборок и при агрегации предсказаний слабых моделей. В то же время в SurvBESA используется механизм самовнимания, с помощью которого усредняются функции выживаемости, полученные слабыми моделями. Для моделей предлагается использовать специальное представление весов внимания через модель неточных данных Хьюбера, что значительно снижает вычислительную сложность и позволяет решать более простую оптимизационную задачу. Проведенные численные эксперименты демонстрируют свойства модели на синтетических данных. Сравнение с существующими методами анализа выживаемости на реальных данных подтверждает эффективность предложенного подхода.

In machine learning, several ensemble methods have been developed for survival analysis, including random survival forests, gradient boosting based on weak models, and ensembles of Cox models. In this paper, two new ensemble models are proposed, SurvBETA (Survival Beran Estimator Ensemble using Three Attention mechanisms) and SurvBESA (Survival Beran Estimator Ensemble using Self-Attention), expanding the set of existing approaches. Beran models are used as basic algorithms in ensembles, which can be considered as nuclear regression models that take into account the dependencies between objects. The predictions of weak models in the form of conditional survival functions are combined through the mechanism of attention, calculated based on the distance between different objects. A special feature of SurvBETA is the threefold application of the attention mechanism: in the construction of Beran models, in the definition of bootstrap sample prototypes, and in the aggregation of predictions of weak models. At the same time, SurvBESA uses a self-attention mechanism, which averages the survival functions obtained by weak models. For the models, it is proposed to use a special representation of the attention weights through the Huber model of inaccurate data, which significantly reduces computational complexity and allows solving a simpler optimization problem. The numerical experiments performed demonstrate the properties of the model based on synthetic data. Comparison with existing methods of survival analysis based on real data confirms the effectiveness of the proposed approach.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics