Details
Title | Разработка и исследование генеративной модели машинного обучения на основе вариационного автокодера в рамках анализа выживаемости: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика» |
---|---|
Creators | Кирпиченко Станислав Романович |
Scientific adviser | Уткин Лев Владимирович |
Other creators | Константинов А. В. |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2024 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | машинное обучение; генерация данных; вариационный автокодер; анализ выживаемости; оценка Берана; machine learning; data generation; variational autoencoder; survival analysis; Beran estimator |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 01.04.02 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-5712 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\31399 |
Record create date | 8/6/2024 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
В ходе работы была разработана новая модель машинного обучения, основанная на вариационном автокодере и оценке Берана. Описываемая модель главным образом решает 3 задачи: 1. Генерация предсказаний ожидаемого времени события и функции выживаемости для нового входного вектора с помощью оценки Берана. 2. Генерация дополнительных данных, структура которых основана на таковой у обучающей выборки. С помощью вариационного автокодера генерируются новые векторы признаков, с помощью оценки Берана - новые времена событий для них, с помощью стороннего классификатора - новые метки цензурированности. 3. Генерация траектории для входного вектора, зависящей от времени до события. Данная траектория характеризует, как можно было бы изменить признаки данного вектора, чтобы изменилось ожидаемое время события. Траекторию можно рассматривать как алгоритм объяснения в машинном обучении, разновидность контрфактического объяснения. Численные эксперименты, представленные в данной работе, показывают, что разработанная модель успешно выполняет все описанные выше функции как на синтетически сгенерированных данных, так и на реальных.
A new model for generating survival trajectories and data based on applying an autoencoder of a specific structure is proposed. It solves three tasks: 1. Provides predictions in the form of the expected event time and the survival function for a new generated feature vector on the basis of the Beran estimator. 2. Generation of the additional data based on a given training set that would supplement the original dataset. The feature vectors are provided by the variational autoencoder, the expected time to event by the Beran estimator and the censoring labels are generated using a third party classifier. 3. Generation of a prototype time-dependent trajectory for an object, which characterizes how features of the object could be changed to achieve a different time to an event. The trajectory can be viewed as a type of the counterfactual explanation. This paper demonstrates the efficiency and properties of the developed model using numerical experiments on synthetic and real datasets.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0