Details

Title Топологические дескрипторы для анализа данных в системах поведенческой аналитики: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Creators Меженева Ирина Олеговна
Scientific adviser Лукашин Алексей Андреевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2023
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects TDA ; персистентная гомология ; UEBA ; топологические дескрипторы ; кибербезопасность ; persistent homology ; topological descriptors ; cybersecurity
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 02.04.01
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2023/vr/vr23-3872
Rights Доступ по паролю из сети Интернет (чтение, печать)
Record key ru\spstu\vkr\25002
Record create date 8/3/2023

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

В работе рассмотрены основные топологические представления, связанные с сопоставлением анализируемым наборам данных топологических пространств. Основное внимание уделено теории персистентных гомологий, которая лежит в основе топологического анализа данных. Описана процедура симплициальной фильтрации и ее связь с персистентными группами гомологий и модулем персистентности. Приведены основные конструкции теории персистентных гомологий, такие как диаграммы персистентности и штрих-коды. Рассмотрены основные методы векторизации диаграмм персистентности и показано, что реализация этих методов приводит к таким топологическим дескрипторам как кривые Бетти, кривые Эйлера, ландшафтные функции персистентности, образы персистентности. Приведены алгоритмы их построения, описаны основные свойства, приведены преимущества и недостатки при решении практических задач анализа данных и машинного обучения. В результате работы даны общие рекомендации по использованию топологических дескрипторов. Программная реализация выполнена с помощью библиотеки Giotto-tda на языке программирования Python. Приводятся результаты практической апробации применения топологических дескрипторов к данным системы мониторинга работы пользователей корпоративной сети.

The paper considers the basic topological notions related to the comparison of topological spaces to the analyzed data sets. The main attention is paid to the theory of persistent homologies, which is the basis of topological data analysis. The procedure of symplectic filtering and its relation to persistent homology groups and persistence module are described. The basic constructions of persistent homologies theory, such as persistence diagrams and barcodes, are given. Basic methods for vectorizing persistence diagrams are considered and it is shown that the implementation of these methods leads to such topological descriptors as Betti curves, Euler curves, persistence landscape functions, and persistence images. The algorithms for their construction are given, their main properties are described, advantages and disadvantages in solving practical problems of data analysis and machine learning are given. As a result, general recommendations on the use of topological descriptors are given. Software implementation is performed using Giotto-tda library in the Python programming language. The results of practical testing of topological descriptors application to the data of corporate network user activity monitoring system are given.

Network User group Action
ILC SPbPU Local Network All
Read Print
Internet Authorized users SPbPU
Read Print
Internet Anonymous

Access count: 55 
Last 30 days: 2

Detailed usage statistics