Details

Title: Вероятностное моделирование развития пандемии средствами интеллектуального анализа данных: выпускная квалификационная работа магистра: направление 01.04.03 «Механика и математическое моделирование» ; образовательная программа 01.04.03_03 «Механика и цифровое производство»
Creators: Курдина Мария Алексеевна
Scientific adviser: Ле-Захаров Александр Аневич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: искусственный интеллект; анализ данных; машинное обучение; статистические модели; прогнозирование временных рядов; вероятностное прогнозирование; пандемия; Сovid-19; Python; artificial intelligence; data analysis; machine learning; statistical models; time series forecasting; probabilistic forecasting; pandemic; Covid-19
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 01.04.03
Speciality group (FGOS): 010000 - Математика и механика
DOI: 10.18720/SPBPU/3/2023/vr/vr24-242
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally: New arrival
Record key: ru\spstu\vkr\26613

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Данная работа посвящена исследованию возможности применения вероятностного моделирования для прогнозирования развития пандемии Covid-19 и созданию инструмента для предварительной обработки данных и прогнозирования временных рядов на языке Python. Для повышения точности прогнозирования анализируется возможность применения статистики по вакцинации в качестве дополнительного предиктора в прогнозной модели с помощью оценки влияния вакцинации на заболеваемость. Также в данной работе производится сравнение двух статистических моделей и трех моделей машинного обучения для предсказания заболеваемости коронавирусом. Рассматриваются методы экспоненциального сглаживания и ARIMA в качестве статистических подходов к прогнозированию и алгоритмы машинного обучения: k-ближайших соседей, случайный лес, градиентный бустинг. Выбор оптимального алгоритма производится на основе ошибки MAPE, полученной при прогнозе на тестовой выборке, наиболее точного соответствия характеру исходного временного ряда и скорости работы. Результаты исследования показывают, что оптимальным алгоритмом для прогнозирования является градиентный бустинг. Результаты данной работы актуальны, т.к. могут быть полезны для медицинских организаций, государственных структур при принятии мер для предотвращения распространения будущих вспышек вирусных заболеваний.

This paper is devoted to the study of the possibility of using probabilistic modeling to predict the evolution of the Covid-19 pandemic and creating a tool for data pre-processing and time-series forecasting in Python. To improve forecasting accuracy, the possibility of using vaccination statistics as an exogenous variable of the forecast model is analyzed by estimating the effect of vaccination on incidence.  In this paper, two statistical models and three machine learning models for predicting the incidence of coronavirus are compared. Exponential smoothing and ARIMA methods are considered as statistical approaches for prediction and k-nearest neighbors, random forest, and gradient binning algorithms as machine learning methods. The choice of the optimal algorithm is made based on the MAPE obtained from the prediction on the test sample, as well as the best fit to the pattern of the original time series and the speed of the performance. The results of the study show that the optimal algorithm for prediction is the gradient boosting model. The results of this work are relevant, because it can be useful for medical organizations and the government in taking measures to prevent the spread of future epidemics of virus diseases.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics