Details
| Title | Применение методов машинного обучения для прогнозирования вероятности наличия аллергического ринита по клиническим признакам: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features |
|---|---|
| Creators | Андреева Валерия Андреевна |
| Scientific adviser | Нестеров Сергей Александрович |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2026 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | машинное обучение ; аллергический ринит ; бинарная классификация ; логистическая регрессия ; ансамблевые методы ; случайный лес ; градиентный бустинг ; xgboost ; синтетические данные ; дифференциальная диагностика ; machine learning ; allergic rhinitis ; binary classification ; logistic regression ; ensemble methods ; random forest ; gradient boosting ; synthetic data ; differential diagnosis |
| Document type | Bachelor graduation qualification work |
| Language | Russian |
| Level of education | Bachelor |
| Speciality code (FGOS) | 09.03.02 |
| Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2026/vr/vr26-391 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\40236 |
| Record create date | 4/20/2026 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
Данная работа посвящена исследованию моделей машинного обучения для диагностики аллергического ринита на основе клинических признаков. Актуальность исследования обусловлена высокой распространенностью заболевания и необходимостью совершенствования систем поддержки принятия врачебных решений (СППВР), способных повысить точность диагностики в условиях дефицита лабораторных данных и субъективности оценки симптомов. Задачи, которые решались в ходе исследования: 1. Изучение особенностей клинико-диагностических алгоритмов и математическая формализация признакового пространства предметной области. 2. Выявление наиболее информативных диагностических критериев и формирование структуры данных для обучения моделей. 3. Сравнительный анализ и обоснование выбора алгоритмов машинного обучения для прогнозирования вероятности заболевания. 4. Исследования методов генерации синтетических наборов данных и анализ их статистических свойств для контроля распределений. 5. Построение и обучение моделей бинарной классификации и оценка качества на валидационной и тестовой выборках с использованием метрик. Работа проведена с использованием языка программирования Python и библиотек машинного обучения scikit-learn, XGBoost, а также библиотек для обработки данных Pandas и NumPy. Синтетический набор данных был сгенерирован на основе формализованных клинических рекомендаций и вероятностных моделей, что обеспечило его клиническую достоверность. Разработаны эффективные алгоритмические рекомендации по применению методов машинного обучения для снижения диагностических ошибок.
The subject of the graduate qualification work is «Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features». The given work is devoted to studying defects of machine learning models for the diagnosis of allergic rhinitis based on clinical features. The relevance of the research is driven by the high prevalence of the disease and the need to improve Clinical Decision Support Systems. Such systems are capable of increasing diagnostic accuracy in conditions of laboratory data scarcity and the inherent subjectivity of symptom assessment. The research set the following goals: 1. Studying features of clinical diagnostic algorithms and mathematical formalization of the domain feature space. 2. Detection of most informative diagnostic criteria and data structure development for model training. 3. Comparative analysis and justification of machine learning algorithms for disease probability prediction. 4. Investigation of synthetic data generation methods and analyzing statistical properties to ensure distribution consistency. 5. Developing and training binary classifiers, and assessing their quality on validation and test sets using key metrics. The research was conducted using the Python programming language along with machine learning libraries such as scikit-learn and XGBoost, and data processing libraries including Pandas and NumPy. A synthetic dataset was generated based on formalized clinical guidelines and probabilistic models, ensuring its clinical validity. Effective algorithmic recommendations for the application of machine learning methods were developed to reduce diagnostic errors.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0