Детальная информация

Ковалев, Максим Сергеевич. Разработка и исследование робастных (минимаксных) моделей классификации и регрессии для малых выборок на основе случайных лесов [Электронный ресурс] = Imprecise Robust Classification and Regression Models for Small Samples Based on Random Forests: выпускная квалификационная работа магистра: 01.04.02 - Прикладная математика и информатика ; 01.04.02_01 - Математическое моделирование в науке и индустрии / М. С. Ковалев; Санкт-Петербургский политехнический университет Петра Великого, Институт прикладной математики и механики ; науч. рук. Л. В. Уткин ; консультант по нормоконтролю Л. А. Арефьева. — Электрон. текстовые дан. (1 файл : 1,1 Мб). — Санкт-Петербург, 2019. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/vr19-848.pdf>. — <URL:http://doi.org/10.18720/SPBPU/3/2019/vr/vr19-848>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-848-o.pdf>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-848-r.pdf>. — <URL:http://elib.spbstu.ru/dl/3/2019/vr/rev/vr19-848-a.pdf>.

Дата создания записи: 18.09.2019

Тематика: классификация; регрессия; случайный лес; дерево решений; обобщенная модель дирихле; робастная модель засорения; доверительный интервал; classification; regression; random forest; decision tree; imprecise dirichlet model; linear-vacuous mixture; confidence interval

Коллекции: Выпускные квалификационные работы; Общая коллекция

Ссылки: DOI; Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований

Разрешенные действия: Прочитать Загрузить (1,1 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе предложены робастные модификации алгоритма машинного обучения – случайный лес, которые используются для решения задач классификации и регрессии. Случайный лес реализуются с помощью построения множества деревьев решений и усреднения их результатов. Для выборок малого размера их результат нельзя рассматривать как точный. Основная идея модификаций состоит в замене обычного усреднения на взвешенное усреднение, при этом веса учитывают, что оценки деревьев решений являются неточными. Для этого точечные прогнозы заменяются на интервальные с помощью интервальных статистических моделей и доверительных интервалов. Предложены специальные модификации целевых функций в задачах классификации и регрессии, чтобы упростить задачи оптимизации для вычисления оптимальных весов.

In the given work, one proposes robust modifications of the machine learning algorithm, Random Forest, which are used to solve classification and regression problems. Random Forest is implemented by constructing a set of Decision Trees and averaging their estimates. For small samples, the estimates cannot be regarded as accurate. The main idea of the modifications is replacing the usual averaging by a weighted averaging in which weights take into account that the estimates of decision trees are imprecise. For this, point forecasts are replaced by interval forecasts using Imprecise Statistical Inference Models and Confidence Intervals. Special modifications of objective functions in classification and regression problems are proposed in order to simplify optimization problems for calculating optimal weights.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 21
За последние 30 дней: 6
Подробная статистика