Details

Title Разработка и исследование модели машинного обучения с использованием функции расстояния на основе случайных деревьев: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_02 «Системное программирование»
Creators Горюнов Максим Юрьевич
Scientific adviser Уткин Лев Владимирович
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects машинное обучение ; решающие деревья ; экстремально случайные деревья ; случайный лес ; ядерная регрессия Надарая-Уотсона ; функция расстояния ; перенос обучения ; machine learning ; decision trees ; extremely randomized trees ; random forest ; Nadaraya-Watson kernel regression ; distance function ; transfer learning
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 01.03.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2025/vr/vr25-3153
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\37042
Record create date 8/28/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Целью работы является разработка модели машинного обучения на базе леса из экстремально случайных деревьев. В ходе исследования решались следующие задачи: 1. Разработка архитектуры модели. Основой предложенного метода является формула расстояния, учитывающая структуру разбиения узлов в деревьях, формирующих случайный лес. Расстояния, полученные посредством данной метрики, являются компонентой ядерной функции в регрессии Надарая-Уотсона. 2. Разработка метода применения рассматриваемой модели в задаче переноса обучения. 3. Проведение сравнительных тестов на задачах классификации и регрессии с прочими методами машинного обучения: ядерной регрессией с гауссовым ядром, K ближайших соседей, простым лесом из экстремально случайных деревьев. Численные эксперименты показали, что полученная модель сравнима по используемым метрикам оценки эффективности с остальными классификаторами. Кроме того, проведенные тесты доказали пригодность предложенного подхода для задачи регрессии с применением переноса обучения за счет превосходства результатов разработанной модели по сравнению с прочими регрессорами на некоторых наборах данных.

The objective of the work is to develop a machine learning model based on an extremely randomized trees forest. The study addressed the following tasks: 1. Development of the model architecture. The foundation of the proposed method is a distance formula that accounts for the node-splitting structure in the trees comprising the random forest. The distances obtained through this metric serve as a component of the kernel function in Nadaraya-Watson regression. 2. Development of a method for applying the proposed model in transfer learning tasks. 3. Comparative testing on classification and regression problems with other machine learning methods: Gaussian kernel regression, K-nearest neighbors, and a basic extremely randomized trees forest. Numerical experiments demonstrated that the resulting model performs comparably to other classifiers in terms of standard evaluation metrics. Furthermore, the conducted tests confirmed the suitability of the proposed approach for transfer learning regression tasks, as the developed model outperformed other regressors on certain datasets.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • Разработка и исследование модели машинного обучения с использованием функции расстояния на основе случайных деревьев
    • Введение
    • 1. Случайные деревья. Задачи классификации и регрессии
    • 2. Разработка модели, основанной на функции расстояния с использованием случайных деревьев
    • 3. Техническая реализация разработанной модели
    • 4. Численные эксперименты
    • Заключение
    • Список использованных источников

Access count: 0 
Last 30 days: 0

Detailed usage statistics