Details
Title | Разработка и исследование модели машинного обучения с использованием функции расстояния на основе случайных деревьев: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_02 «Системное программирование» |
---|---|
Creators | Горюнов Максим Юрьевич |
Scientific adviser | Уткин Лев Владимирович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | машинное обучение ; решающие деревья ; экстремально случайные деревья ; случайный лес ; ядерная регрессия Надарая-Уотсона ; функция расстояния ; перенос обучения ; machine learning ; decision trees ; extremely randomized trees ; random forest ; Nadaraya-Watson kernel regression ; distance function ; transfer learning |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 01.03.02 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3153 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37042 |
Record create date | 8/28/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Целью работы является разработка модели машинного обучения на базе леса из экстремально случайных деревьев. В ходе исследования решались следующие задачи: 1. Разработка архитектуры модели. Основой предложенного метода является формула расстояния, учитывающая структуру разбиения узлов в деревьях, формирующих случайный лес. Расстояния, полученные посредством данной метрики, являются компонентой ядерной функции в регрессии Надарая-Уотсона. 2. Разработка метода применения рассматриваемой модели в задаче переноса обучения. 3. Проведение сравнительных тестов на задачах классификации и регрессии с прочими методами машинного обучения: ядерной регрессией с гауссовым ядром, K ближайших соседей, простым лесом из экстремально случайных деревьев. Численные эксперименты показали, что полученная модель сравнима по используемым метрикам оценки эффективности с остальными классификаторами. Кроме того, проведенные тесты доказали пригодность предложенного подхода для задачи регрессии с применением переноса обучения за счет превосходства результатов разработанной модели по сравнению с прочими регрессорами на некоторых наборах данных.
The objective of the work is to develop a machine learning model based on an extremely randomized trees forest. The study addressed the following tasks: 1. Development of the model architecture. The foundation of the proposed method is a distance formula that accounts for the node-splitting structure in the trees comprising the random forest. The distances obtained through this metric serve as a component of the kernel function in Nadaraya-Watson regression. 2. Development of a method for applying the proposed model in transfer learning tasks. 3. Comparative testing on classification and regression problems with other machine learning methods: Gaussian kernel regression, K-nearest neighbors, and a basic extremely randomized trees forest. Numerical experiments demonstrated that the resulting model performs comparably to other classifiers in terms of standard evaluation metrics. Furthermore, the conducted tests confirmed the suitability of the proposed approach for transfer learning regression tasks, as the developed model outperformed other regressors on certain datasets.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- Разработка и исследование модели машинного обучения с использованием функции расстояния на основе случайных деревьев
- Введение
- 1. Случайные деревья. Задачи классификации и регрессии
- 2. Разработка модели, основанной на функции расстояния с использованием случайных деревьев
- 3. Техническая реализация разработанной модели
- 4. Численные эксперименты
- Заключение
- Список использованных источников
Access count: 0
Last 30 days: 0