Details
Title | Разработка и исследование моделей машинного обучения в рамках анализа выживаемости: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
---|---|
Creators | Ефременко Влада Андреевна |
Scientific adviser | Уткин Лев Владимирович |
Other creators | Константинов А. В. |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | анализ выживаемости ; цензурированные наблюдения ; классификация ; механизм внимания ; интервальные вероятности ; survival analysis ; censored observations ; classification ; attention mechanism ; imprecise probabilities |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 02.04.01 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3682 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37413 |
Record create date | 9/19/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена разработке методов машинного обучения для решения задачи анализа выживаемости – ключевого инструмента моделирования времени до наступления событий в таких областях, как медицина, инженерия и финансы, где цензурирование наблюдений является проблемой, существенно затрудняющей построение точных прогностических моделей. В рамках работы были предложены три новые модели анализа выживаемости: iSurvM, iSurvQ и iSurvJ. Эти модели основаны на сочетании теории интервальной вероятности и механизмов внимания и не предполагает жестких параметрических допущений. Основная идея заключается в представлении цензурированных наблюдений в виде интервальных вероятностных распределений по моментам времени между событиями. Далее применяется регрессия Надарая-Уотсона с обучаемыми весами внимания для оценки интервального распределения вероятностей на всем наборе данных. Для обучения были рассмотрены три стратегии принятия решений, каждая из которых легла в основу соответствующей модели. Эффективность предложенных подходов была протестирована на синтетических и реальных наборах данных, где модели, особенно iSurvQ и iSurvJ, показали устойчивое превосходство над классическим непараметрическим оцениванием, таким как оценка Берана, как с точки зрения точности, так и вычислительной эффективности.
This work is devoted to the development of machine learning methods applied to solving the problem of survival analysis – a key tool for modeling time-to-event outcomes in fields such as medicine, engineering, and finance, where censored observations are a common issue that significantly complicates the construction of accurate predictive models. As part of the study, three novel survival analysis models were proposed: iSurvM, iSurvQ, and iSurvJ. These models are based on a combination of imprecise probability theory and attention mechanisms and do not rely on strict parametric assumptions. The core idea is to represent censored observations by interval-valued probability distributions over the time intervals between event moments. Subsequently, Nadaraya-Watson regression with trainable attention weights is applied to estimate the imprecise probability distribution for the entire dataset. Three decision strategies were considered for training, each forming the basis of the corresponding model. The effectiveness of the proposed approaches was evaluated on synthetic and real datasets, where the models – particularly iSurvQ and iSurvJ – demonstrated consistent superiority over classical nonparametric methods such as the Beran estimator from the accuracy and computational complexity points of view.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0