Детальная информация

Название: Разработка и исследование новых алгоритмов глубокого градиентного бустинга для решения задач большой размерности: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_02 «Математические методы анализа и визуализации данных»
Авторы: Константинов Андрей Владимирович
Научный руководитель: Уткин Лев Владимирович
Другие авторы: Арефьева Людмила Анатольевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; восстановление регрессии; классификация; деревья решений; градиентный бустинг; machine learning; regression; classification; decision trees; gradient boosting machine
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 01.04.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1059
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\8229

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Данная работа посвящена исследованию и разработке новых алгоритмов машинного обучения на основе деревьев решений для решения задач восстановления регрессии и классификации. Задачи, которые решались в ходе исследования: 1. Изучение и анализ наиболее актуальных подходов решения задач регрессии и классификации на основе деревьев решений. 2. Разработка новых алгоритмов машинного обучения. 3. Исследование и анализ полученных алгоритмов. 4. Сравнение с существующими алгоритмами, основанными на деревьях решений. Были проанализированы недостатки существующих алгоритмов, основанных на деревьях решений, а также применимость глубокого леса к задаче регрессии. В результате разработаны два принципиально новых алгоритма машинного обучения: глубокий градиентный бустинг и адаптивная композиция моделей градиентного бустинга; а также модификация алгоритма градиентного бустинга деревьев решений. Проведено множество численных экспериментов и сравнение с существующими актуальными алгоритмами машинного обучения, такими как: случайный лес и градиентный бустинг деревьев решений, в том числе XGBoost и CatBoost. Результаты сравнения указывают на возможность построения более точных моделей с помощью предложенных алгоритмов.

This paper is devoted to development of new machine learning algorithms for regression and classification tasks based on decision trees. The research set the following goals: 1. Research of decision tree-based machine learning approaches. 2. Development of new machine learning algorithms. 3. Analysis of developed algorithms. 4. Comparison with other decision tree-based machine learning algorithms. The analysis of currently available decision tree-based algorithms has been made. Also, the applicability of Deep Forest to the regression task has been revised. The study resulted in two brand new machine learning algorithms: deep gradient boosting and adaptive gradient boosting ensemble; and the modification of decision tree-based gradient boosting. The numerical experiments made during the research, and comparison with other decision tree-based algorithms, including Random Forest, XGBoost and CatBoost, show that developed methods can be used to construct more precise models.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • Введение
  • Глава 1. Постановка задачи и анализ литературы
    • 1.1. Актуальные подходы машинного обучения
    • 1.2. Формальная постановка задачи машинного обучения с учителем
    • 1.3. Случайный лес и чрезвычайно рандомизированные деревья
    • 1.4. Алгоритм градиентного бустинга
  • Глава 2. Алгоритмы глубокого градиентного бустинга
    • 2.1. Адаптивная композиция моделей градиентного бустинга
    • 2.3. Градиентный бустинг на основе глубокого леса
    • 2.3. Усовершенствование классического алгоритма градиентного бустинга
    • 2.5. Эксперименты и результаты
  • Заключение
  • Список литературных источников

Статистика использования

stat Количество обращений: 45
За последние 30 дней: 0
Подробная статистика