Детальная информация
Название | Критерии и алгоритмы выбора лучшей модели для прогнозной аналитики: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом» |
---|---|
Авторы | Дзюин Андрей Михайлович |
Научный руководитель | Светуньков Сергей Геннадьевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | ARIMA ; временные ряды ; прогнозирование ; AIC ; BIC ; PIC ; информационные критерии ; байесовский анализ ; прогнозная аналитика ; time series ; forecasting ; information criteria ; bayesian analysis ; predictive analytics |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 09.04.04 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2024 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\35341 |
Дата создания записи | 10.07.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Цель работы - исследовать и сравнить информационные критерии AIC, BIC и PIC при выборе моделей ARIMA в задаче прогнозирования временных рядов, а также предложить усовершенствованный вариант PIC на основе вероятностного подхода. Работа выполнена на основе временных рядов из международной базы данных M3 Competition, включающей реальные данные из различных прикладных областей. Предмет ВКР - алгоритмы выбора моделей временных рядов, их теоретическое обоснование и прикладная эффективность в прогнозной аналитике. Использованные методы: - теоретический анализ научной литературы по моделям ARIMA и информационным критериям; - реализация ARIMA(p,d,q)-моделей на языке Python; - расчёт и сравнительный анализ критериев AIC, BIC, PIC; - модификация критерия PIC с использованием вероятностей на основе нормального распределения; - экспериментальная оценка моделей по метрике MAE. Основные результаты работы: - рассмотрены и формализованы теоретические основы моделей ARIMA и их применения в прогнозировании; - проанализированы возможности и ограничения информационных критериев AIC и BIC; - предложена и обоснована модификация критерия PIC, заменяющая коэффициент детерминации на вероятностную оценку; - реализован алгоритм построения и оценки моделей ARIMA с расчётом всех трёх критериев; - проведено прикладное тестирование на 501 временном ряде, результаты оформлены в виде итоговой таблицы; - установлено, что предложенная версия PIC чаще указывает на модель с наименьшей прогнозной ошибкой по MAE, чем AIC и BIC. Область применения результатов ВКР - задачи краткосрочного прогнозирования временных рядов в экономике, логистике, маркетинге, а также в любых аналитических системах, требующих выбора оптимальной модели прогнозирования на ограниченных данных. Научной новизной является применение вероятностной интерпретации критерия PIC для выбора прогностических моделей ARIMA. Такой подход позволяет отказаться от ограничений, связанных с использованием коэффициента детерминации, и предлагает более универсальную и обоснованную статистическую характеристику точности модели. Разработанная модификация критерия PIC повышает достоверность выбора модели, обладающей наилучшими прогнозными свойствами, и может быть использована в интеллектуальных системах аналитики. Выводы. Поставленные задачи выполнены, цель работы достигнута. Предложенная модификация критерия PIC показала свою эффективность и практическую применимость в задачах прогнозной аналитики. Результаты исследования имеют как теоретическую ценность, так и практическую значимость, а разработанный подход может быть использован при построении интеллектуальных систем прогнозирования.
The objective of the research is to study and compare the information criteria AIC, BIC, and PIC for selecting ARIMA models in time series forecasting tasks, and to propose an improved version of the PIC criterion based on a probabilistic approach. The study was conducted using time series data from the international M3 Competition database, which contains real-world observations from various application domains. The subject of the thesis - model selection algorithms for time series forecasting, their theoretical justification, and practical effectiveness in predictive analytics. Methods used: - theoretical review of scientific literature on ARIMA models and information criteria; - implementation of ARIMA(p,d,q) models using Python; - calculation and comparative analysis of the AIC, BIC, and PIC criteria; - modification of the PIC criterion using probability estimates based on the normal distribution; - experimental model evaluation using the MAE metric. The main results of the study: - theoretical foundations of ARIMA models and their application in forecasting were examined and formalized; - the capabilities and limitations of the AIC and BIC criteria were analyzed; - a modified version of the PIC criterion was proposed and justified, replacing the coefficient of determination with a probabilistic estimate; - an algorithm was developed for constructing and evaluating ARIMA models with calculation of all three criteria; - an empirical analysis was conducted on 501 time series, with the results documented in a summary table; - it was established that the proposed version of the PIC criterion more frequently identifies the model with the lowest forecast error (based on MAE) compared to AIC and BIC. Application domain of the thesis results - short-term time series forecasting in economics, logistics, marketing, and any analytical systems requiring optimal model selection on limited data. The scientific novelty lies in the application of a probabilistic interpretation of the PIC criterion for selecting ARIMA forecasting models. This approach eliminates the limitations associated with the use of the coefficient of determination and offers a more universal and statistically grounded measure of model accuracy. The proposed modification of the PIC criterion enhances the reliability of selecting models with superior predictive capabilities and can be applied in intelligent analytics systems. Conclusions. The research tasks were accomplished, and the objective of the thesis was achieved. The proposed modification of the PIC criterion has demonstrated its effectiveness and practical relevance in forecasting tasks. The results of the study possess both theoretical and practical value, and the developed approach can be utilized in building intelligent forecasting systems.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0