С 17 марта 2020 г. для ресурсов (учебные, научные, материалы конференций, статьи из периодических изданий, авторефераты диссертаций, диссертации) ЭБ СПбПУ, обеспечивающих образовательный процесс, установлен особый режим использования. Обращаем внимание, что ВКР/НД не относятся к этой категории.

Детальная информация

Название: Разработка и исследование робастных (минимаксных) моделей классификации и регрессии для малых выборок на основе случайных лесов: выпускная квалификационная работа магистра: 01.04.02 - Прикладная математика и информатика ; 01.04.02_01 - Математическое моделирование в науке и индустрии
Авторы: Ковалев Максим Сергеевич
Научный руководитель: Уткин Лев Владимирович
Другие авторы: Арефьева Людмила Анатольевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2019
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Функции (мат.) Дирихле; Искусственный интеллект; классификация; регрессия; случайный лес; дерево решений; машинное обучение; робастная модель засорения; доверительный интервал
УДК: 517.537.6; 004.8; 519.246.85
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 01.04.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-848
Права доступа: Свободный доступ из сети Интернет (чтение, печать, копирование)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе предложены робастные модификации алгоритма машинного обучения – случайный лес, которые используются для решения задач классификации и регрессии. Случайный лес реализуются с помощью построения множества деревьев решений и усреднения их результатов. Для выборок малого размера их результат нельзя рассматривать как точный. Основная идея модификаций состоит в замене обычного усреднения на взвешенное усреднение, при этом веса учитывают, что оценки деревьев решений являются неточными. Для этого точечные прогнозы заменяются на интервальные с помощью интервальных статистических моделей и доверительных интервалов. Предложены специальные модификации целевых функций в задачах классификации и регрессии, чтобы упростить задачи оптимизации для вычисления оптимальных весов.

In the given work, one proposes robust modifications of the machine learning algorithm, Random Forest, which are used to solve classification and regression problems. Random Forest is implemented by constructing a set of Decision Trees and averaging their estimates. For small samples, the estimates cannot be regarded as accurate. The main idea of the modifications is replacing the usual averaging by a weighted averaging in which weights take into account that the estimates of decision trees are imprecise. For this, point forecasts are replaced by interval forecasts using Imprecise Statistical Inference Models and Confidence Intervals. Special modifications of objective functions in classification and regression problems are proposed in order to simplify optimization problems for calculating optimal weights.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 51
За последние 30 дней: 3
Подробная статистика