Details
Title | Топологические дескрипторы для анализа данных в системах поведенческой аналитики: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
---|---|
Creators | Меженева Ирина Олеговна |
Scientific adviser | Лукашин Алексей Андреевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2023 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | TDA ; персистентная гомология ; UEBA ; топологические дескрипторы ; кибербезопасность ; persistent homology ; topological descriptors ; cybersecurity |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 02.04.01 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-3872 |
Rights | Доступ по паролю из сети Интернет (чтение, печать) |
Record key | ru\spstu\vkr\25002 |
Record create date | 8/3/2023 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
В работе рассмотрены основные топологические представления, связанные с сопоставлением анализируемым наборам данных топологических пространств. Основное внимание уделено теории персистентных гомологий, которая лежит в основе топологического анализа данных. Описана процедура симплициальной фильтрации и ее связь с персистентными группами гомологий и модулем персистентности. Приведены основные конструкции теории персистентных гомологий, такие как диаграммы персистентности и штрих-коды. Рассмотрены основные методы векторизации диаграмм персистентности и показано, что реализация этих методов приводит к таким топологическим дескрипторам как кривые Бетти, кривые Эйлера, ландшафтные функции персистентности, образы персистентности. Приведены алгоритмы их построения, описаны основные свойства, приведены преимущества и недостатки при решении практических задач анализа данных и машинного обучения. В результате работы даны общие рекомендации по использованию топологических дескрипторов. Программная реализация выполнена с помощью библиотеки Giotto-tda на языке программирования Python. Приводятся результаты практической апробации применения топологических дескрипторов к данным системы мониторинга работы пользователей корпоративной сети.
The paper considers the basic topological notions related to the comparison of topological spaces to the analyzed data sets. The main attention is paid to the theory of persistent homologies, which is the basis of topological data analysis. The procedure of symplectic filtering and its relation to persistent homology groups and persistence module are described. The basic constructions of persistent homologies theory, such as persistence diagrams and barcodes, are given. Basic methods for vectorizing persistence diagrams are considered and it is shown that the implementation of these methods leads to such topological descriptors as Betti curves, Euler curves, persistence landscape functions, and persistence images. The algorithms for their construction are given, their main properties are described, advantages and disadvantages in solving practical problems of data analysis and machine learning are given. As a result, general recommendations on the use of topological descriptors are given. Software implementation is performed using Giotto-tda library in the Python programming language. The results of practical testing of topological descriptors application to the data of corporate network user activity monitoring system are given.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 55
Last 30 days: 2