Details
Title | Методы и модели машинного обучения для оценки кредитных рисков: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» |
---|---|
Creators | Сабуров Сергей Сергеевич |
Scientific adviser | Логинова Александра Викторовна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | кредитный скоринг; машинное обучение; логистическая регрессия; случайный лес; градиентный бустинг; xgboost; credit scoring; machine learning; logistic regression; random forest; gradient boosting; xgboost. |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 09.03.02 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-80 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\34201 |
Record create date | 2/26/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Тема выпускной квалификационной работы: «Методы и модели машинного обучения для оценки кредитных рисков». Данная работа посвящена созданию и сравнительному анализу моделей машинного обучения для задач кредитного скоринга. Выполнен обзор существующих подходов и моделей машинного обучения, применяемых в данной области, что позволило обосновать методы для их использования в работе. Затем была выполнена предобработка данных, включая устранение пропусков, масштабирование признаков и кодирование категориальных данных, что обеспечило корректное функционирование алгоритмов. На следующем этапе были реализованы модели машинного обучения, такие как логистическая регрессия, случайный лес, градиентный бустинг и XGBoost. Для повышения качества предсказаний проводилась настройка гиперпараметров, а затем модели сравнивались по метрике ROC-AUC, чтобы определить их эффективность. Завершающим этапом стал анализ важности признаков, который позволил интерпретировать результаты и подготовить рекомендации для практического применения моделей. Работа выполнена с использованием Python и современных библиотек для анализа данных и машинного обучения: Pandas, Scikit-learn, Matplotlib, XGBoost. В результате были построены модели, наиболее точной из которых оказалась XGBoost, показавшая наивысшее значение ROC-AUC. Предложены рекомендации для применения полученных результатов в реальных системах кредитного скоринга.
The subject of the graduate qualification work is “Methods and models of machine learning for credit risk assessment”. This study focuses on the research of methods and models of machine learning used for credit risk assessment. An overview of the existing approaches and models of machine learning used in this field was conducted to identify the most suitable approaches. Data preprocessing followed, including handling missing values, scaling features, and encoding categorical variables, ensuring the datasets were optimized for model training. Machine learning models such as logistic regression, random forest, gradient boosting, and XGBoost were then developed and tested. To enhance model performance, hyperparameter tuning was performed, and models were compared using the ROC-AUC metric to evaluate their effectiveness. Finally, feature importance was analyzed to gain insights into the key factors influencing predictions, and recommendations were provided to further improve the accuracy and reliability of credit risk assessments. The work was performed using Python and modern data analysis and machine learning libraries such as Pandas, Scikit-learn, Matplotlib, and XGBoost. The study concluded that the XGBoost model demonstrated the highest accuracy among the considered algorithms. Based on the results, practical recommendations were developed for applying machine learning methods in credit scoring systems.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0