Details

Title Методы и модели машинного обучения для оценки кредитных рисков: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Creators Сабуров Сергей Сергеевич
Scientific adviser Логинова Александра Викторовна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы; Общая коллекция
Subjects кредитный скоринг; машинное обучение; логистическая регрессия; случайный лес; градиентный бустинг; xgboost; credit scoring; machine learning; logistic regression; random forest; gradient boosting; xgboost.
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.02
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-80
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\34201
Record create date 2/26/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Тема выпускной квалификационной работы: «Методы и модели машинного обучения для оценки кредитных рисков». Данная работа посвящена созданию и сравнительному анализу моделей машинного обучения для задач кредитного скоринга. Выполнен обзор существующих подходов и моделей машинного обучения, применяемых в данной области, что позволило обосновать методы для их использования в работе. Затем была выполнена предобработка данных, включая устранение пропусков, масштабирование признаков и кодирование категориальных данных, что обеспечило корректное функционирование алгоритмов. На следующем этапе были реализованы модели машинного обучения, такие как логистическая регрессия, случайный лес, градиентный бустинг и XGBoost. Для повышения качества предсказаний проводилась настройка гиперпараметров, а затем модели сравнивались по метрике ROC-AUC, чтобы определить их эффективность. Завершающим этапом стал анализ важности признаков, который позволил интерпретировать результаты и подготовить рекомендации для практического применения моделей. Работа выполнена с использованием Python и современных библиотек для анализа данных и машинного обучения: Pandas, Scikit-learn, Matplotlib, XGBoost. В результате были построены модели, наиболее точной из которых оказалась XGBoost, показавшая наивысшее значение ROC-AUC. Предложены рекомендации для применения полученных результатов в реальных системах кредитного скоринга.

The subject of the graduate qualification work is “Methods and models of machine learning for credit risk assessment”. This study focuses on the research of methods and models of machine learning used for credit risk assessment. An overview of the existing approaches and models of machine learning used in this field was conducted to identify the most suitable approaches. Data preprocessing followed, including handling missing values, scaling features, and encoding categorical variables, ensuring the datasets were optimized for model training. Machine learning models such as logistic regression, random forest, gradient boosting, and XGBoost were then developed and tested. To enhance model performance, hyperparameter tuning was performed, and models were compared using the ROC-AUC metric to evaluate their effectiveness. Finally, feature importance was analyzed to gain insights into the key factors influencing predictions, and recommendations were provided to further improve the accuracy and reliability of credit risk assessments. The work was performed using Python and modern data analysis and machine learning libraries such as Pandas, Scikit-learn, Matplotlib, and XGBoost. The study concluded that the XGBoost model demonstrated the highest accuracy among the considered algorithms. Based on the results, practical recommendations were developed for applying machine learning methods in credit scoring systems.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics