Детальная информация

Название Модификация моделей деревьев решений и случайного леса для обеспечения робастности и точности классификации на основе введения случайного шума: выпускная квалификационная работа бакалавра: направление 02.03.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.03.03_01 «Интеллектуальные информационные системы и обработка данных»
Авторы Елизарова Анастасия Павловна
Научный руководитель Уткин Лев Владимирович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика машинное обучение; классификация; деревья решений; CART; случайный лес; перекрытие классов; введение случайного шума; machine learning; classification; decision tree; random forest; class overlapping; random noise addition
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 02.03.03
Группа специальностей ФГОС 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2024/vr/vr24-2585
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\30276
Дата создания записи 11.07.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена разработке модификации алгоритма деревьев решений CART для решения задачи классификации на данных с проблемой перекрытия классов. Реализовано его применение в ансамблевом методе случайного леса. Проведено исследование особенностей работы оригинального алгоритма CART, разработана и реализована модификация на основе введения случайного шума на этапе обучения алгоритма, а именно, копирования тренировочных наблюдений наиболее близких к разделяющей гиперплоскости. Экспериментальное исследование показало, что случайный лес, построенный на модифицированном алгоритме CART, позволяет получать более точные предсказания на данных с пересечением классов. Исследование качества алгоритма проводилось на открытых наборах данных преимущественно из сферы медицины.

This paper is devoted to the development of modification of the CART decision tree algorithm for solving the classification tasks on data with class overlap problem. The developed modification has been applied as a part of a Random Forest. The specifics of the original CART algorithm were investigated. Modification based on introduction of random noise during training of the algorithm, namely, copying the training objects closest to the separating hyperplane was developed and implemented. The experimental study showed that the random forest based on the modified CART algorithm produces more accurate predictions on data with overlapping classes. The quality of the algorithm was investigated on public datasets mainly from the medical field.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 2 
За последние 30 дней: 0

Подробная статистика