Details

Title Вероятностное моделирование развития пандемии средствами интеллектуального анализа данных: выпускная квалификационная работа магистра: направление 01.04.03 «Механика и математическое моделирование» ; образовательная программа 01.04.03_03 «Механика и цифровое производство»
Creators Курдина Мария Алексеевна
Scientific adviser Ле-Захаров Александр Аневич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2023
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects Искусственный интеллект ; Машинное обучение ; Математическое моделирование ; анализ данных ; статистические модели ; прогнозирование временных рядов ; вероятностное прогнозирование ; пандемия ; data analysis ; statistical models ; time series forecasting ; probabilistic forecasting ; pandemic
UDC 004.85 ; 519.876.5
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 01.04.03
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2023/vr/vr24-242
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key ru\spstu\vkr\26613
Record create date 2/14/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена исследованию возможности применения вероятностного моделирования для прогнозирования развития пандемии Covid-19 и созданию инструмента для предварительной обработки данных и прогнозирования временных рядов на языке Python. Для повышения точности прогнозирования анализируется возможность применения статистики по вакцинации в качестве дополнительного предиктора в прогнозной модели с помощью оценки влияния вакцинации на заболеваемость. Также в данной работе производится сравнение двух статистических моделей и трех моделей машинного обучения для предсказания заболеваемости коронавирусом. Рассматриваются методы экспоненциального сглаживания и ARIMA в качестве статистических подходов к прогнозированию и алгоритмы машинного обучения: k-ближайших соседей, случайный лес, градиентный бустинг. Выбор оптимального алгоритма производится на основе ошибки MAPE, полученной при прогнозе на тестовой выборке, наиболее точного соответствия характеру исходного временного ряда и скорости работы. Результаты исследования показывают, что оптимальным алгоритмом для прогнозирования является градиентный бустинг. Результаты данной работы актуальны, т.к. могут быть полезны для медицинских организаций, государственных структур при принятии мер для предотвращения распространения будущих вспышек вирусных заболеваний.

This paper is devoted to the study of the possibility of using probabilistic modeling to predict the evolution of the Covid-19 pandemic and creating a tool for data pre-processing and time-series forecasting in Python. To improve forecasting accuracy, the possibility of using vaccination statistics as an exogenous variable of the forecast model is analyzed by estimating the effect of vaccination on incidence.  In this paper, two statistical models and three machine learning models for predicting the incidence of coronavirus are compared. Exponential smoothing and ARIMA methods are considered as statistical approaches for prediction and k-nearest neighbors, random forest, and gradient binning algorithms as machine learning methods. The choice of the optimal algorithm is made based on the MAPE obtained from the prediction on the test sample, as well as the best fit to the pattern of the original time series and the speed of the performance. The results of the study show that the optimal algorithm for prediction is the gradient boosting model. The results of this work are relevant, because it can be useful for medical organizations and the government in taking measures to prevent the spread of future epidemics of virus diseases.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics