Детальная информация
| Название | Разработка и исследование ансамблевых моделей в рамках анализа выживаемости: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
|---|---|
| Авторы | Хомец Семен Павлович |
| Научный руководитель | Уткин Лев Владимирович |
| Другие авторы | Константинов А. В. |
| Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Выходные сведения | Санкт-Петербург, 2025 |
| Коллекция | Выпускные квалификационные работы ; Общая коллекция |
| Тематика | анализ выживаемости ; модель берана ; ансамблевые модели ; линейная оптимизация ; механизм внимания ; survival analysis ; berans model ; ensemble models ; linear optimisation ; attention mechanism |
| Тип документа | Выпускная квалификационная работа магистра |
| Тип файла | |
| Язык | Русский |
| Уровень высшего образования | Магистратура |
| Код специальности ФГОС | 02.04.01 |
| Группа специальностей ФГОС | 020000 - Компьютерные и информационные науки |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-4301 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | ru\spstu\vkr\38927 |
| Дата создания записи | 24.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
В машинном обучении для анализа выживаемости разработан ряд ансамблевых методов, включая случайные леса выживаемости, градиентный бустинг на основе слабых моделей и ансамбли моделей Кокса. В данной работе предложены две новые ансамблевая модель SurvBETA (Survival Beran Estimator Ensemble using Three Attention mechanisms) и SurvBESA (Survival Beran Estimator Ensemble using Self-Attention), расширяющие набор существующих подходов. В качестве базовых алгоритмов в ансамблях используются модели Берана, которые можно рассматривать как ядерные регрессионные модели, учитывающие зависимости между объектами. Предсказания слабых моделей в форме условных функций выживаемости объединяются посредством механизма внимания, вычисляемого на основе расстояния между различными объектами. Особенностью SurvBETA является тройное применение механизма внимания: при построении моделей Берана, при определении прототипов бутстреп-выборок и при агрегации предсказаний слабых моделей. В то же время в SurvBESA используется механизм самовнимания, с помощью которого усредняются функции выживаемости, полученные слабыми моделями. Для моделей предлагается использовать специальное представление весов внимания через модель неточных данных Хьюбера, что значительно снижает вычислительную сложность и позволяет решать более простую оптимизационную задачу. Проведенные численные эксперименты демонстрируют свойства модели на синтетических данных. Сравнение с существующими методами анализа выживаемости на реальных данных подтверждает эффективность предложенного подхода.
In machine learning, several ensemble methods have been developed for survival analysis, including random survival forests, gradient boosting based on weak models, and ensembles of Cox models. In this paper, two new ensemble models are proposed, SurvBETA (Survival Beran Estimator Ensemble using Three Attention mechanisms) and SurvBESA (Survival Beran Estimator Ensemble using Self-Attention), expanding the set of existing approaches. Beran models are used as basic algorithms in ensembles, which can be considered as nuclear regression models that take into account the dependencies between objects. The predictions of weak models in the form of conditional survival functions are combined through the mechanism of attention, calculated based on the distance between different objects. A special feature of SurvBETA is the threefold application of the attention mechanism: in the construction of Beran models, in the definition of bootstrap sample prototypes, and in the aggregation of predictions of weak models. At the same time, SurvBESA uses a self-attention mechanism, which averages the survival functions obtained by weak models. For the models, it is proposed to use a special representation of the attention weights through the Huber model of inaccurate data, which significantly reduces computational complexity and allows solving a simpler optimization problem. The numerical experiments performed demonstrate the properties of the model based on synthetic data. Comparison with existing methods of survival analysis based on real data confirms the effectiveness of the proposed approach.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0