Детальная информация

Название Топологические дескрипторы для анализа данных в системах поведенческой аналитики: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Авторы Меженева Ирина Олеговна
Научный руководитель Лукашин Алексей Андреевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения Санкт-Петербург, 2023
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика TDA ; персистентная гомология ; UEBA ; топологические дескрипторы ; кибербезопасность ; persistent homology ; topological descriptors ; cybersecurity
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 02.04.01
Группа специальностей ФГОС 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2023/vr/vr23-3872
Права доступа Доступ по паролю из сети Интернет (чтение, печать)
Ключ записи ru\spstu\vkr\25002
Дата создания записи 03.08.2023

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В работе рассмотрены основные топологические представления, связанные с сопоставлением анализируемым наборам данных топологических пространств. Основное внимание уделено теории персистентных гомологий, которая лежит в основе топологического анализа данных. Описана процедура симплициальной фильтрации и ее связь с персистентными группами гомологий и модулем персистентности. Приведены основные конструкции теории персистентных гомологий, такие как диаграммы персистентности и штрих-коды. Рассмотрены основные методы векторизации диаграмм персистентности и показано, что реализация этих методов приводит к таким топологическим дескрипторам как кривые Бетти, кривые Эйлера, ландшафтные функции персистентности, образы персистентности. Приведены алгоритмы их построения, описаны основные свойства, приведены преимущества и недостатки при решении практических задач анализа данных и машинного обучения. В результате работы даны общие рекомендации по использованию топологических дескрипторов. Программная реализация выполнена с помощью библиотеки Giotto-tda на языке программирования Python. Приводятся результаты практической апробации применения топологических дескрипторов к данным системы мониторинга работы пользователей корпоративной сети.

The paper considers the basic topological notions related to the comparison of topological spaces to the analyzed data sets. The main attention is paid to the theory of persistent homologies, which is the basis of topological data analysis. The procedure of symplectic filtering and its relation to persistent homology groups and persistence module are described. The basic constructions of persistent homologies theory, such as persistence diagrams and barcodes, are given. Basic methods for vectorizing persistence diagrams are considered and it is shown that the implementation of these methods leads to such topological descriptors as Betti curves, Euler curves, persistence landscape functions, and persistence images. The algorithms for their construction are given, their main properties are described, advantages and disadvantages in solving practical problems of data analysis and machine learning are given. As a result, general recommendations on the use of topological descriptors are given. Software implementation is performed using Giotto-tda library in the Python programming language. The results of practical testing of topological descriptors application to the data of corporate network user activity monitoring system are given.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать
Интернет Анонимные пользователи

Количество обращений: 55 
За последние 30 дней: 2

Подробная статистика