Детальная информация

Название Разработка и исследование ансамблевых моделей в рамках анализа выживаемости: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Авторы Хомец Семен Павлович
Научный руководитель Уткин Лев Владимирович
Другие авторы Константинов А. В.
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика анализ выживаемости ; модель берана ; ансамблевые модели ; линейная оптимизация ; механизм внимания ; survival analysis ; berans model ; ensemble models ; linear optimisation ; attention mechanism
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 02.04.01
Группа специальностей ФГОС 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2025/vr/vr25-4301
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\38927
Дата создания записи 24.09.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В машинном обучении для анализа выживаемости разработан ряд ансамблевых методов, включая случайные леса выживаемости, градиентный бустинг на основе слабых моделей и ансамбли моделей Кокса. В данной работе предложены две новые ансамблевая модель SurvBETA (Survival Beran Estimator Ensemble using Three Attention mechanisms) и SurvBESA (Survival Beran Estimator Ensemble using Self-Attention), расширяющие набор существующих подходов. В качестве базовых алгоритмов в ансамблях используются модели Берана, которые можно рассматривать как ядерные регрессионные модели, учитывающие зависимости между объектами. Предсказания слабых моделей в форме условных функций выживаемости объединяются посредством механизма внимания, вычисляемого на основе расстояния между различными объектами. Особенностью SurvBETA является тройное применение механизма внимания: при построении моделей Берана, при определении прототипов бутстреп-выборок и при агрегации предсказаний слабых моделей. В то же время в SurvBESA используется механизм самовнимания, с помощью которого усредняются функции выживаемости, полученные слабыми моделями. Для моделей предлагается использовать специальное представление весов внимания через модель неточных данных Хьюбера, что значительно снижает вычислительную сложность и позволяет решать более простую оптимизационную задачу. Проведенные численные эксперименты демонстрируют свойства модели на синтетических данных. Сравнение с существующими методами анализа выживаемости на реальных данных подтверждает эффективность предложенного подхода.

In machine learning, several ensemble methods have been developed for survival analysis, including random survival forests, gradient boosting based on weak models, and ensembles of Cox models. In this paper, two new ensemble models are proposed, SurvBETA (Survival Beran Estimator Ensemble using Three Attention mechanisms) and SurvBESA (Survival Beran Estimator Ensemble using Self-Attention), expanding the set of existing approaches. Beran models are used as basic algorithms in ensembles, which can be considered as nuclear regression models that take into account the dependencies between objects. The predictions of weak models in the form of conditional survival functions are combined through the mechanism of attention, calculated based on the distance between different objects. A special feature of SurvBETA is the threefold application of the attention mechanism: in the construction of Beran models, in the definition of bootstrap sample prototypes, and in the aggregation of predictions of weak models. At the same time, SurvBESA uses a self-attention mechanism, which averages the survival functions obtained by weak models. For the models, it is proposed to use a special representation of the attention weights through the Huber model of inaccurate data, which significantly reduces computational complexity and allows solving a simpler optimization problem. The numerical experiments performed demonstrate the properties of the model based on synthetic data. Comparison with existing methods of survival analysis based on real data confirms the effectiveness of the proposed approach.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика