Детальная информация

Название Применение методов машинного обучения для прогнозирования вероятности наличия аллергического ринита по клиническим признакам: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features
Авторы Андреева Валерия Андреевна
Научный руководитель Нестеров Сергей Александрович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2026
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика машинное обучение ; аллергический ринит ; бинарная классификация ; логистическая регрессия ; ансамблевые методы ; случайный лес ; градиентный бустинг ; xgboost ; синтетические данные ; дифференциальная диагностика ; machine learning ; allergic rhinitis ; binary classification ; logistic regression ; ensemble methods ; random forest ; gradient boosting ; synthetic data ; differential diagnosis
Тип документа Выпускная квалификационная работа бакалавра
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.02
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2026/vr/vr26-391
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\40236
Дата создания записи 20.04.2026

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена исследованию моделей машинного обучения для диагностики аллергического ринита на основе клинических признаков. Актуальность исследования обусловлена высокой распространенностью заболевания и необходимостью совершенствования систем поддержки принятия врачебных решений (СППВР), способных повысить точность диагностики в условиях дефицита лабораторных данных и субъективности оценки симптомов. Задачи, которые решались в ходе исследования: 1. Изучение особенностей клинико-диагностических алгоритмов и математическая формализация признакового пространства предметной области. 2. Выявление наиболее информативных диагностических критериев и формирование структуры данных для обучения моделей. 3. Сравнительный анализ и обоснование выбора алгоритмов машинного обучения для прогнозирования вероятности заболевания. 4. Исследования методов генерации синтетических наборов данных и анализ их статистических свойств для контроля распределений. 5. Построение и обучение моделей бинарной классификации и оценка качества на валидационной и тестовой выборках с использованием метрик. Работа проведена с использованием языка программирования Python и библиотек машинного обучения scikit-learn, XGBoost, а также библиотек для обработки данных Pandas и NumPy. Синтетический набор данных был сгенерирован на основе формализованных клинических рекомендаций и вероятностных моделей, что обеспечило его клиническую достоверность. Разработаны эффективные алгоритмические рекомендации по применению методов машинного обучения для снижения диагностических ошибок.

The subject of the graduate qualification work is «Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features». The given work is devoted to studying defects of machine learning models for the diagnosis of allergic rhinitis based on clinical features. The relevance of the research is driven by the high prevalence of the disease and the need to improve Clinical Decision Support Systems. Such systems are capable of increasing diagnostic accuracy in conditions of laboratory data scarcity and the inherent subjectivity of symptom assessment. The research set the following goals: 1. Studying features of clinical diagnostic algorithms and mathematical formalization of the domain feature space. 2. Detection of most informative diagnostic criteria and data structure development for model training. 3. Comparative analysis and justification of machine learning algorithms for disease probability prediction. 4. Investigation of synthetic data generation methods and analyzing statistical properties to ensure distribution consistency. 5. Developing and training binary classifiers, and assessing their quality on validation and test sets using key metrics. The research was conducted using the Python programming language along with machine learning libraries such as scikit-learn and XGBoost, and data processing libraries including Pandas and NumPy. A synthetic dataset was generated based on formalized clinical guidelines and probabilistic models, ensuring its clinical validity. Effective algorithmic recommendations for the application of machine learning methods were developed to reduce diagnostic errors.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика