Details

Title Нахождение граничных измерений выборки для кусочно-линейной регрессии: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика»
Creators Забродин Кирилл
Scientific adviser Баженов Александр Николаевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects интервальный анализ ; интервал ; кусочно-линейная регрессия ; точки излома ; interval analysis ; interval ; piecewice linear regression ; break points
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 01.03.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2025/vr/vr25-3265
Rights Доступ по паролю из сети Интернет (чтение, печать)
Additionally New arrival
Record key ru\spstu\vkr\38397
Record create date 9/23/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Выпускная квалификационная работа посвящена разработке и экспериментальному исследованию алгоритма построения кусочно-линейных интервальных регрессионных моделей с автоматическим определением точек излома. Актуальность темы обусловлена тем, что во многих инженерных и природоохранных задачах исходные данные фиксируются в виде интервалов, а зависимости между параметрами имеют выраженную нелинейную структуру. Классические методы регрессии либо игнорируют измерительные погрешности, либо требуют заранее задавать положение разрывов, что ухудшает интерпретируемость и приводит к переобучению. Цель работы — создать метод, который на основе принципов интервального анализа позволяет находить максимально широкий «коридор необходимости», целиком содержащий интервальные наблюдения, и одновременно ограничивать сложность модели числом точек излома. Практическая значимость подтверждена двумя наборами реальных данных. Для среднемесячных осадков Санкт-Петербурга (2015–2024 гг.) оптимальной оказалась модель с тремя изломами, сократившая интервал прогноза по метрике Уинклера на 45 % по сравнению с линейной регрессией при сохранении охвата 83 % наблюдений. Для годовых температурных аномалий Berkeley Earth (2000–2024 гг.) наилучший компромисс достигнут при восьми изломах: индекс Жаккара вырос до 0,659, а ширина коридора уменьшилась примерно на 85 % относительно модели без изломов. Полученные результаты показывают, что разработанный алгоритм эффективно детектирует структурные изменения тренда и формирует узкие, но надёжные интервальные прогнозы без ручного выбора точек разрыва.

The final thesis is devoted to the development and experimental study of an algorithm for constructing piecewise linear interval regression models with automatic detection of break points. The relevance of the topic is due to the fact that in many engineering and environmental problems, the initial data is fixed in the form of intervals, and the dependencies between the parameters have a pronounced nonlinear structure. Classical regression methods either ignore measurement errors or require the position of gaps to be set in advance, which impairs interpretability and leads to overfitting. The aim of the work is to create a method that, based on the principles of interval analysis, makes it possible to find the widest possible "corridor of necessity entirely containing interval observations, and at the same time limit the complexity of the model to the number of breakpoints. The practical significance is confirmed by two sets of real data. For the average monthly precipitation in St. Petersburg (2015-2024) , the three-kink model turned out to be optimal, reducing the forecast interval according to the Winkler metric by 45% compared with linear regression while maintaining coverage of 83% of observations. For annual temperature According to the Berkeley Earth anomalies (2000-2024), the best compromise was achieved with eight fractures: the Jacquard index increased to 0.659, and the width of the corridor decreased by about 85% relative to the model without fractures. The results show that the developed algorithm effectively detects structural trend changes and generates narrow but reliable interval forecasts without manually selecting breakpoints.

Network User group Action
ILC SPbPU Local Network All
Read Print
Internet Authorized users SPbPU
Read Print
Internet Anonymous
  • Нахождение граничных измерений выборки для кусочно-линейной регрессии
    • Введение
    • 1. Теория
    • 2. Реализация
    • 3. Анализ экспериментов
    • Заключение
    • Список использованных источников

Access count: 0 
Last 30 days: 0

Detailed usage statistics