Details

Title Разработка и исследование методов машинного обучения для обнаружения аномальных данных с использованием моделей внимания: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
Creators Агеев Андрей Юрьевич
Scientific adviser Уткин Лев Владимирович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Научные работы аспирантов/докторантов ; Общая коллекция
Subjects Машинное обучение ; Нейронные сети ; обнаружение аномалий ; изоляционный лес ; механизм внимания ; автоэнкодер ; полуконтролируемое обучение ; градиентная оптимизация ; робастность к шуму ; anomaly detection ; isolation forest ; attention mechanism ; autoencoder ; semi-supervised learning ; gradient optimization ; robustness to noise
UDC 004.85 ; 004.032.26
Document type Scientific report
Language Russian
Level of education Graduate student
Speciality code (FGOS) 09.06.01
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
Rights Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Record key ru\spstu\vkr\39395
Record create date 10/17/2025

В данной работе представлены разработка и исследование методов машинного обучения для обнаружения аномальных данных на основе интеграции изоляционного леса с механизмами нейронного внимания. Предложено три новых подхода: изоляционный лес с механизмом внимания (ИЛМВ), автоэнкодер обнаружения аномалий с нейронным лесом внимания (АОАНЛВ) и изоляционный лес с обучаемыми функциями оценки внимания (ИЛМВФО). Разработанные методы обеспечивают адаптивное взвешивание компонентов ансамбля, учитывая релевантность каждого дерева для конкретного анализируемого экземпляра. Проведены комплексные эксперименты на репрезентативных наборах данных из медицинской, финансовой и технической областей, демонстрирующие превосходство предложенных методов над классическими подходами с улучшением F1-меры до 21% и повышением устойчивости к шумовым искажениям. Создан программный комплекс с открытым исходным кодом, реализующий все предложенные алгоритмы для практического применения в задачах кибербезопасности, финансового мониторинга, медицинской диагностики и промышленного контроля качества.

This paper presents the development and study of machine learning methods for detecting anomalies in data based on the integration of isolation forest with neural attention mechanisms. Three new approaches are proposed: attention based isolation forest with attention mechanism (ABIF), anomaly detection autoencoder with neural attention forest (ADA-NAF), and attention based isolation forest with trainable attention functions (ABIF-SF). The developed methods provide adaptive weighting of ensemble components, taking into account the relevance of each tree for a particular analyzed instance. Comprehensive experiments were conducted on representative datasets from the medical, financial, and technical fields, demonstrating the superiority of the proposed methods over classical approaches with an improvement in the F1-measure of up to 21% and increased resistance to noise distortions. An open-source software package was created that implements all the proposed algorithms for practical application in cybersecurity, financial monitoring, medical diagnostics, and industrial quality control.