Детальная информация

Название Разработка и исследование методов машинного обучения для обнаружения аномальных данных с использованием моделей внимания: научный доклад: направление подготовки 09.06.01 «Информатика и вычислительная техника» ; направленность 09.06.01_06 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»
Авторы Агеев Андрей Юрьевич
Научный руководитель Уткин Лев Владимирович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Научные работы аспирантов/докторантов ; Общая коллекция
Тематика Машинное обучение ; Нейронные сети ; обнаружение аномалий ; изоляционный лес ; механизм внимания ; автоэнкодер ; полуконтролируемое обучение ; градиентная оптимизация ; робастность к шуму ; anomaly detection ; isolation forest ; attention mechanism ; autoencoder ; semi-supervised learning ; gradient optimization ; robustness to noise
УДК 004.85 ; 004.032.26
Тип документа Научный доклад
Язык Русский
Уровень высшего образования Аспирантура
Код специальности ФГОС 09.06.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
Права доступа Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Ключ записи ru\spstu\vkr\39395
Дата создания записи 17.10.2025

В данной работе представлены разработка и исследование методов машинного обучения для обнаружения аномальных данных на основе интеграции изоляционного леса с механизмами нейронного внимания. Предложено три новых подхода: изоляционный лес с механизмом внимания (ИЛМВ), автоэнкодер обнаружения аномалий с нейронным лесом внимания (АОАНЛВ) и изоляционный лес с обучаемыми функциями оценки внимания (ИЛМВФО). Разработанные методы обеспечивают адаптивное взвешивание компонентов ансамбля, учитывая релевантность каждого дерева для конкретного анализируемого экземпляра. Проведены комплексные эксперименты на репрезентативных наборах данных из медицинской, финансовой и технической областей, демонстрирующие превосходство предложенных методов над классическими подходами с улучшением F1-меры до 21% и повышением устойчивости к шумовым искажениям. Создан программный комплекс с открытым исходным кодом, реализующий все предложенные алгоритмы для практического применения в задачах кибербезопасности, финансового мониторинга, медицинской диагностики и промышленного контроля качества.

This paper presents the development and study of machine learning methods for detecting anomalies in data based on the integration of isolation forest with neural attention mechanisms. Three new approaches are proposed: attention based isolation forest with attention mechanism (ABIF), anomaly detection autoencoder with neural attention forest (ADA-NAF), and attention based isolation forest with trainable attention functions (ABIF-SF). The developed methods provide adaptive weighting of ensemble components, taking into account the relevance of each tree for a particular analyzed instance. Comprehensive experiments were conducted on representative datasets from the medical, financial, and technical fields, demonstrating the superiority of the proposed methods over classical approaches with an improvement in the F1-measure of up to 21% and increased resistance to noise distortions. An open-source software package was created that implements all the proposed algorithms for practical application in cybersecurity, financial monitoring, medical diagnostics, and industrial quality control.