Детальная информация
Название | Разработка и исследование модели машинного обучения с использованием функции расстояния на основе случайных деревьев: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_02 «Системное программирование» |
---|---|
Авторы | Горюнов Максим Юрьевич |
Научный руководитель | Уткин Лев Владимирович |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | машинное обучение ; решающие деревья ; экстремально случайные деревья ; случайный лес ; ядерная регрессия Надарая-Уотсона ; функция расстояния ; перенос обучения ; machine learning ; decision trees ; extremely randomized trees ; random forest ; Nadaraya-Watson kernel regression ; distance function ; transfer learning |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 01.03.02 |
Группа специальностей ФГОС | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3153 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\37042 |
Дата создания записи | 28.08.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Целью работы является разработка модели машинного обучения на базе леса из экстремально случайных деревьев. В ходе исследования решались следующие задачи: 1. Разработка архитектуры модели. Основой предложенного метода является формула расстояния, учитывающая структуру разбиения узлов в деревьях, формирующих случайный лес. Расстояния, полученные посредством данной метрики, являются компонентой ядерной функции в регрессии Надарая-Уотсона. 2. Разработка метода применения рассматриваемой модели в задаче переноса обучения. 3. Проведение сравнительных тестов на задачах классификации и регрессии с прочими методами машинного обучения: ядерной регрессией с гауссовым ядром, K ближайших соседей, простым лесом из экстремально случайных деревьев. Численные эксперименты показали, что полученная модель сравнима по используемым метрикам оценки эффективности с остальными классификаторами. Кроме того, проведенные тесты доказали пригодность предложенного подхода для задачи регрессии с применением переноса обучения за счет превосходства результатов разработанной модели по сравнению с прочими регрессорами на некоторых наборах данных.
The objective of the work is to develop a machine learning model based on an extremely randomized trees forest. The study addressed the following tasks: 1. Development of the model architecture. The foundation of the proposed method is a distance formula that accounts for the node-splitting structure in the trees comprising the random forest. The distances obtained through this metric serve as a component of the kernel function in Nadaraya-Watson regression. 2. Development of a method for applying the proposed model in transfer learning tasks. 3. Comparative testing on classification and regression problems with other machine learning methods: Gaussian kernel regression, K-nearest neighbors, and a basic extremely randomized trees forest. Numerical experiments demonstrated that the resulting model performs comparably to other classifiers in terms of standard evaluation metrics. Furthermore, the conducted tests confirmed the suitability of the proposed approach for transfer learning regression tasks, as the developed model outperformed other regressors on certain datasets.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
- Разработка и исследование модели машинного обучения с использованием функции расстояния на основе случайных деревьев
- Введение
- 1. Случайные деревья. Задачи классификации и регрессии
- 2. Разработка модели, основанной на функции расстояния с использованием случайных деревьев
- 3. Техническая реализация разработанной модели
- 4. Численные эксперименты
- Заключение
- Список использованных источников
Количество обращений: 0
За последние 30 дней: 0