Разработка и исследование методов машинного обучения для обнаружения аномальных данных с использованием моделей внимания: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» = Development and research of machine learning methods for detecting abnormal data using attention models

Агеев, Андрей Юрьевич

Details

Title	Разработка и исследование методов машинного обучения для обнаружения аномальных данных с использованием моделей внимания: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» = Development and research of machine learning methods for detecting abnormal data using attention models
Creators	Агеев Андрей Юрьевич
Scientific adviser	Уткин Лев Владимирович
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint	Санкт-Петербург, 2025
Collection	Научные работы аспирантов/докторантов ; Общая коллекция
Subjects	Машинное обучение ; Нейронные сети ; обнаружение аномалий ; изоляционный лес ; механизм внимания ; автоэнкодер ; полуконтролируемое обучение ; градиентная оптимизация ; робастность к шуму ; anomaly detection ; isolation forest ; attention mechanism ; autoencoder ; semi-supervised learning ; gradient optimization ; robustness to noise
UDC	004.85; 004.032.26
Document type	Scientific report
Language	Russian
Level of education	Graduate student
Speciality code (FGOS)	09.06.01
Speciality group (FGOS)	090000 - Информатика и вычислительная техника
Rights	Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Record key	ru\spstu\vkr\39395
Record create date	10/17/2025

В данной работе представлены разработка и исследование методов машинного обучения для обнаружения аномальных данных на основе интеграции изоляционного леса с механизмами нейронного внимания. Предложено три новых подхода: изоляционный лес с механизмом внимания (ИЛМВ), автоэнкодер обнаружения аномалий с нейронным лесом внимания (АОАНЛВ) и изоляционный лес с обучаемыми функциями оценки внимания (ИЛМВФО). Разработанные методы обеспечивают адаптивное взвешивание компонентов ансамбля, учитывая релевантность каждого дерева для конкретного анализируемого экземпляра. Проведены комплексные эксперименты на репрезентативных наборах данных из медицинской, финансовой и технической областей, демонстрирующие превосходство предложенных методов над классическими подходами с улучшением F1-меры до 21% и повышением устойчивости к шумовым искажениям. Создан программный комплекс с открытым исходным кодом, реализующий все предложенные алгоритмы для практического применения в задачах кибербезопасности, финансового мониторинга, медицинской диагностики и промышленного контроля качества.

This paper presents the development and study of machine learning methods for detecting anomalies in data based on the integration of isolation forest with neural attention mechanisms. Three new approaches are proposed: attention based isolation forest with attention mechanism (ABIF), anomaly detection autoencoder with neural attention forest (ADA-NAF), and attention based isolation forest with trainable attention functions (ABIF-SF). The developed methods provide adaptive weighting of ensemble components, taking into account the relevance of each tree for a particular analyzed instance. Comprehensive experiments were conducted on representative datasets from the medical, financial, and technical fields, demonstrating the superiority of the proposed methods over classical approaches with an improvement in the F1-measure of up to 21% and increased resistance to noise distortions. An open-source software package was created that implements all the proposed algorithms for practical application in cybersecurity, financial monitoring, medical diagnostics, and industrial quality control.