Details

Title: Анализ подходов к оценке предвзятости моделей классификации: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Creators: Ляхова Софья Александровна
Scientific adviser: Платонов Владимир Владимирович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт кибербезопасности и защиты информации
Imprint: Санкт-Петербург, 2022
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: предвзятость данных; справедливость классификации; измерение предвзятости; машинное обучение; data bias; classification fairness; algorithmic bias; bias measurement; machine learning
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 10.03.01
Speciality group (FGOS): 100000 - Информационная безопасность
DOI: 10.18720/SPBPU/3/2022/vr/vr22-1031
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\17204

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Анализ подходов к оценке предвзятости моделей классификации». Цель дипломной работы - повышение качества работы предвзятой модели классификации вредоносных и безопасных веб-страниц на основе метрик справедливости. Предметом исследования является оценка предвзятости бинарного классификатора на основе метрик справедливости. Задачи, решаемые в ходе исследования:Исследование существующих математических определений понятий предвзятости и справедливости моделей машинного обучения.Классификация предвзятостей моделей машинного обучения и выявление причин их возникновения.Исследование существующих подходов к оценке производительности и предвзятости моделей классификации. Обучение модели бинарной классификации веб-страниц на предвзятой выборке и применение к ней алгоритмов устранения предвзятости. Оценка значений метрик производительности и справедливости обученных моделей и вывод о качестве их работы.В результате работы был реализован инструмент, позволяющий оценивать изменения показателей справедливости в процессе разработки модели классификации и сравнивать обученные модели по показателям справедливости между собой. Была продемонстрирована работа данного инструмента на модели классификации вредоносных и безопасных веб-страниц. Полученные результаты могут быть использованы в качестве основы для интегрирования оценки справедливости в процесс обучения моделей классификации.

The theme of the graduate qualification work: "Analysis of approaches to assessing the bias of classification models". The purpose of the study is to improve the performance of a biased model for classifying malicious and benign web pages based on fairness metrics. The subject of the study is the assessment of the bias of a binary classifier based on fairness metrics. Tasks to be solved in the course of the study:Research of existing mathematical definitions of the concepts of bias and fairness of machine learning models. Classification of biases that occur in machine learning models and identifying the cause of their occurrence. Examining of existing approaches to assessing the bias of models. Training a binary classification model of web pages on a biased sample and applying bias elimination algorithms to it.Evaluation the values of performance metrics and bias of the trained models and draw conclusions about the quality of their work.As a result of the work, a tool was implemented that allows assessing changes in equity indicators in the process of developing a classification model and comparing models in terms of equity indicators with each other. The operation of this tool was demonstrated on a model for classifying malicious and safe web pages. The obtained results can be used as a basis for integrating the fairness assessment into the learning process of classification models.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Usage statistics

stat Access count: 27
Last 30 days: 0
Detailed usage statistics