Details
| Title | Разработка и исследование методов машинного обучения для обнаружения аномальных данных с использованием моделей внимания: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» |
|---|---|
| Creators | Агеев Андрей Юрьевич |
| Scientific adviser | Уткин Лев Владимирович |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Научные работы аспирантов/докторантов ; Общая коллекция |
| Subjects | Машинное обучение ; Нейронные сети ; обнаружение аномалий ; изоляционный лес ; механизм внимания ; автоэнкодер ; полуконтролируемое обучение ; градиентная оптимизация ; робастность к шуму ; anomaly detection ; isolation forest ; attention mechanism ; autoencoder ; semi-supervised learning ; gradient optimization ; robustness to noise |
| UDC | 004.85 ; 004.032.26 |
| Document type | Scientific report |
| Language | Russian |
| Level of education | Graduate student |
| Speciality code (FGOS) | 09.06.01 |
| Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
| Rights | Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141 |
| Record key | ru\spstu\vkr\39395 |
| Record create date | 10/17/2025 |
В данной работе представлены разработка и исследование методов машинного обучения для обнаружения аномальных данных на основе интеграции изоляционного леса с механизмами нейронного внимания. Предложено три новых подхода: изоляционный лес с механизмом внимания (ИЛМВ), автоэнкодер обнаружения аномалий с нейронным лесом внимания (АОАНЛВ) и изоляционный лес с обучаемыми функциями оценки внимания (ИЛМВФО). Разработанные методы обеспечивают адаптивное взвешивание компонентов ансамбля, учитывая релевантность каждого дерева для конкретного анализируемого экземпляра. Проведены комплексные эксперименты на репрезентативных наборах данных из медицинской, финансовой и технической областей, демонстрирующие превосходство предложенных методов над классическими подходами с улучшением F1-меры до 21% и повышением устойчивости к шумовым искажениям. Создан программный комплекс с открытым исходным кодом, реализующий все предложенные алгоритмы для практического применения в задачах кибербезопасности, финансового мониторинга, медицинской диагностики и промышленного контроля качества.
This paper presents the development and study of machine learning methods for detecting anomalies in data based on the integration of isolation forest with neural attention mechanisms. Three new approaches are proposed: attention based isolation forest with attention mechanism (ABIF), anomaly detection autoencoder with neural attention forest (ADA-NAF), and attention based isolation forest with trainable attention functions (ABIF-SF). The developed methods provide adaptive weighting of ensemble components, taking into account the relevance of each tree for a particular analyzed instance. Comprehensive experiments were conducted on representative datasets from the medical, financial, and technical fields, demonstrating the superiority of the proposed methods over classical approaches with an improvement in the F1-measure of up to 21% and increased resistance to noise distortions. An open-source software package was created that implements all the proposed algorithms for practical application in cybersecurity, financial monitoring, medical diagnostics, and industrial quality control.