Details

Title Применение методов машинного обучения для прогнозирования вероятности наличия аллергического ринита по клиническим признакам: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features
Creators Андреева Валерия Андреевна
Scientific adviser Нестеров Сергей Александрович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2026
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects машинное обучение ; аллергический ринит ; бинарная классификация ; логистическая регрессия ; ансамблевые методы ; случайный лес ; градиентный бустинг ; xgboost ; синтетические данные ; дифференциальная диагностика ; machine learning ; allergic rhinitis ; binary classification ; logistic regression ; ensemble methods ; random forest ; gradient boosting ; synthetic data ; differential diagnosis
Document type Bachelor graduation qualification work
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.02
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2026/vr/vr26-391
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\40236
Record create date 4/20/2026

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена исследованию моделей машинного обучения для диагностики аллергического ринита на основе клинических признаков. Актуальность исследования обусловлена высокой распространенностью заболевания и необходимостью совершенствования систем поддержки принятия врачебных решений (СППВР), способных повысить точность диагностики в условиях дефицита лабораторных данных и субъективности оценки симптомов. Задачи, которые решались в ходе исследования: 1. Изучение особенностей клинико-диагностических алгоритмов и математическая формализация признакового пространства предметной области. 2. Выявление наиболее информативных диагностических критериев и формирование структуры данных для обучения моделей. 3. Сравнительный анализ и обоснование выбора алгоритмов машинного обучения для прогнозирования вероятности заболевания. 4. Исследования методов генерации синтетических наборов данных и анализ их статистических свойств для контроля распределений. 5. Построение и обучение моделей бинарной классификации и оценка качества на валидационной и тестовой выборках с использованием метрик. Работа проведена с использованием языка программирования Python и библиотек машинного обучения scikit-learn, XGBoost, а также библиотек для обработки данных Pandas и NumPy. Синтетический набор данных был сгенерирован на основе формализованных клинических рекомендаций и вероятностных моделей, что обеспечило его клиническую достоверность. Разработаны эффективные алгоритмические рекомендации по применению методов машинного обучения для снижения диагностических ошибок.

The subject of the graduate qualification work is «Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features». The given work is devoted to studying defects of machine learning models for the diagnosis of allergic rhinitis based on clinical features. The relevance of the research is driven by the high prevalence of the disease and the need to improve Clinical Decision Support Systems. Such systems are capable of increasing diagnostic accuracy in conditions of laboratory data scarcity and the inherent subjectivity of symptom assessment. The research set the following goals: 1. Studying features of clinical diagnostic algorithms and mathematical formalization of the domain feature space. 2. Detection of most informative diagnostic criteria and data structure development for model training. 3. Comparative analysis and justification of machine learning algorithms for disease probability prediction. 4. Investigation of synthetic data generation methods and analyzing statistical properties to ensure distribution consistency. 5. Developing and training binary classifiers, and assessing their quality on validation and test sets using key metrics. The research was conducted using the Python programming language along with machine learning libraries such as scikit-learn and XGBoost, and data processing libraries including Pandas and NumPy. A synthetic dataset was generated based on formalized clinical guidelines and probabilistic models, ensuring its clinical validity. Effective algorithmic recommendations for the application of machine learning methods were developed to reduce diagnostic errors.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics