Детальная информация
| Название | Применение методов машинного обучения для прогнозирования вероятности наличия аллергического ринита по клиническим признакам: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features |
|---|---|
| Авторы | Андреева Валерия Андреевна |
| Научный руководитель | Нестеров Сергей Александрович |
| Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Выходные сведения | Санкт-Петербург, 2026 |
| Коллекция | Выпускные квалификационные работы ; Общая коллекция |
| Тематика | машинное обучение ; аллергический ринит ; бинарная классификация ; логистическая регрессия ; ансамблевые методы ; случайный лес ; градиентный бустинг ; xgboost ; синтетические данные ; дифференциальная диагностика ; machine learning ; allergic rhinitis ; binary classification ; logistic regression ; ensemble methods ; random forest ; gradient boosting ; synthetic data ; differential diagnosis |
| Тип документа | Выпускная квалификационная работа бакалавра |
| Язык | Русский |
| Уровень высшего образования | Бакалавриат |
| Код специальности ФГОС | 09.03.02 |
| Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2026/vr/vr26-391 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | ru\spstu\vkr\40236 |
| Дата создания записи | 20.04.2026 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
Данная работа посвящена исследованию моделей машинного обучения для диагностики аллергического ринита на основе клинических признаков. Актуальность исследования обусловлена высокой распространенностью заболевания и необходимостью совершенствования систем поддержки принятия врачебных решений (СППВР), способных повысить точность диагностики в условиях дефицита лабораторных данных и субъективности оценки симптомов. Задачи, которые решались в ходе исследования: 1. Изучение особенностей клинико-диагностических алгоритмов и математическая формализация признакового пространства предметной области. 2. Выявление наиболее информативных диагностических критериев и формирование структуры данных для обучения моделей. 3. Сравнительный анализ и обоснование выбора алгоритмов машинного обучения для прогнозирования вероятности заболевания. 4. Исследования методов генерации синтетических наборов данных и анализ их статистических свойств для контроля распределений. 5. Построение и обучение моделей бинарной классификации и оценка качества на валидационной и тестовой выборках с использованием метрик. Работа проведена с использованием языка программирования Python и библиотек машинного обучения scikit-learn, XGBoost, а также библиотек для обработки данных Pandas и NumPy. Синтетический набор данных был сгенерирован на основе формализованных клинических рекомендаций и вероятностных моделей, что обеспечило его клиническую достоверность. Разработаны эффективные алгоритмические рекомендации по применению методов машинного обучения для снижения диагностических ошибок.
The subject of the graduate qualification work is «Application of Machine Learning Methods for Predicting the Probability of Allergic Rhinitis Based on Clinical Features». The given work is devoted to studying defects of machine learning models for the diagnosis of allergic rhinitis based on clinical features. The relevance of the research is driven by the high prevalence of the disease and the need to improve Clinical Decision Support Systems. Such systems are capable of increasing diagnostic accuracy in conditions of laboratory data scarcity and the inherent subjectivity of symptom assessment. The research set the following goals: 1. Studying features of clinical diagnostic algorithms and mathematical formalization of the domain feature space. 2. Detection of most informative diagnostic criteria and data structure development for model training. 3. Comparative analysis and justification of machine learning algorithms for disease probability prediction. 4. Investigation of synthetic data generation methods and analyzing statistical properties to ensure distribution consistency. 5. Developing and training binary classifiers, and assessing their quality on validation and test sets using key metrics. The research was conducted using the Python programming language along with machine learning libraries such as scikit-learn and XGBoost, and data processing libraries including Pandas and NumPy. A synthetic dataset was generated based on formalized clinical guidelines and probabilistic models, ensuring its clinical validity. Effective algorithmic recommendations for the application of machine learning methods were developed to reduce diagnostic errors.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0