Details

Title Анализ подходов к оценке предвзятости моделей классификации: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Creators Ляхова Софья Александровна
Scientific adviser Платонов Владимир Владимирович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт кибербезопасности и защиты информации
Imprint Санкт-Петербург, 2022
Collection Выпускные квалификационные работы; Общая коллекция
Subjects предвзятость данных; справедливость классификации; измерение предвзятости; машинное обучение; data bias; classification fairness; algorithmic bias; bias measurement; machine learning
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 10.03.01
Speciality group (FGOS) 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2022/vr/vr22-1031
Rights Доступ по паролю из сети Интернет (чтение)
Record key ru\spstu\vkr\17204
Record create date 7/27/2022

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Тема выпускной квалификационной работы: «Анализ подходов к оценке предвзятости моделей классификации». Цель дипломной работы - повышение качества работы предвзятой модели классификации вредоносных и безопасных веб-страниц на основе метрик справедливости. Предметом исследования является оценка предвзятости бинарного классификатора на основе метрик справедливости. Задачи, решаемые в ходе исследования:Исследование существующих математических определений понятий предвзятости и справедливости моделей машинного обучения.Классификация предвзятостей моделей машинного обучения и выявление причин их возникновения.Исследование существующих подходов к оценке производительности и предвзятости моделей классификации. Обучение модели бинарной классификации веб-страниц на предвзятой выборке и применение к ней алгоритмов устранения предвзятости. Оценка значений метрик производительности и справедливости обученных моделей и вывод о качестве их работы.В результате работы был реализован инструмент, позволяющий оценивать изменения показателей справедливости в процессе разработки модели классификации и сравнивать обученные модели по показателям справедливости между собой. Была продемонстрирована работа данного инструмента на модели классификации вредоносных и безопасных веб-страниц. Полученные результаты могут быть использованы в качестве основы для интегрирования оценки справедливости в процесс обучения моделей классификации.

The theme of the graduate qualification work: "Analysis of approaches to assessing the bias of classification models". The purpose of the study is to improve the performance of a biased model for classifying malicious and benign web pages based on fairness metrics. The subject of the study is the assessment of the bias of a binary classifier based on fairness metrics. Tasks to be solved in the course of the study:Research of existing mathematical definitions of the concepts of bias and fairness of machine learning models. Classification of biases that occur in machine learning models and identifying the cause of their occurrence. Examining of existing approaches to assessing the bias of models. Training a binary classification model of web pages on a biased sample and applying bias elimination algorithms to it.Evaluation the values of performance metrics and bias of the trained models and draw conclusions about the quality of their work.As a result of the work, a tool was implemented that allows assessing changes in equity indicators in the process of developing a classification model and comparing models in terms of equity indicators with each other. The operation of this tool was demonstrated on a model for classifying malicious and safe web pages. The obtained results can be used as a basis for integrating the fairness assessment into the learning process of classification models.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 30 
Last 30 days: 0

Detailed usage statistics