Details
Title | Вероятностное моделирование развития пандемии средствами интеллектуального анализа данных: выпускная квалификационная работа магистра: направление 01.04.03 «Механика и математическое моделирование» ; образовательная программа 01.04.03_03 «Механика и цифровое производство» |
---|---|
Creators | Курдина Мария Алексеевна |
Scientific adviser | Ле-Захаров Александр Аневич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2023 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | Искусственный интеллект ; Машинное обучение ; Математическое моделирование ; анализ данных ; статистические модели ; прогнозирование временных рядов ; вероятностное прогнозирование ; пандемия ; data analysis ; statistical models ; time series forecasting ; probabilistic forecasting ; pandemic |
UDC | 004.85 ; 519.876.5 |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 01.04.03 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2023/vr/vr24-242 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Record key | ru\spstu\vkr\26613 |
Record create date | 2/14/2024 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена исследованию возможности применения вероятностного моделирования для прогнозирования развития пандемии Covid-19 и созданию инструмента для предварительной обработки данных и прогнозирования временных рядов на языке Python. Для повышения точности прогнозирования анализируется возможность применения статистики по вакцинации в качестве дополнительного предиктора в прогнозной модели с помощью оценки влияния вакцинации на заболеваемость. Также в данной работе производится сравнение двух статистических моделей и трех моделей машинного обучения для предсказания заболеваемости коронавирусом. Рассматриваются методы экспоненциального сглаживания и ARIMA в качестве статистических подходов к прогнозированию и алгоритмы машинного обучения: k-ближайших соседей, случайный лес, градиентный бустинг. Выбор оптимального алгоритма производится на основе ошибки MAPE, полученной при прогнозе на тестовой выборке, наиболее точного соответствия характеру исходного временного ряда и скорости работы. Результаты исследования показывают, что оптимальным алгоритмом для прогнозирования является градиентный бустинг. Результаты данной работы актуальны, т.к. могут быть полезны для медицинских организаций, государственных структур при принятии мер для предотвращения распространения будущих вспышек вирусных заболеваний.
This paper is devoted to the study of the possibility of using probabilistic modeling to predict the evolution of the Covid-19 pandemic and creating a tool for data pre-processing and time-series forecasting in Python. To improve forecasting accuracy, the possibility of using vaccination statistics as an exogenous variable of the forecast model is analyzed by estimating the effect of vaccination on incidence. In this paper, two statistical models and three machine learning models for predicting the incidence of coronavirus are compared. Exponential smoothing and ARIMA methods are considered as statistical approaches for prediction and k-nearest neighbors, random forest, and gradient binning algorithms as machine learning methods. The choice of the optimal algorithm is made based on the MAPE obtained from the prediction on the test sample, as well as the best fit to the pattern of the original time series and the speed of the performance. The results of the study show that the optimal algorithm for prediction is the gradient boosting model. The results of this work are relevant, because it can be useful for medical organizations and the government in taking measures to prevent the spread of future epidemics of virus diseases.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0