Детальная информация
Название | Топологические дескрипторы для анализа данных в системах поведенческой аналитики: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
---|---|
Авторы | Меженева Ирина Олеговна |
Научный руководитель | Лукашин Алексей Андреевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Выходные сведения | Санкт-Петербург, 2023 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | TDA ; персистентная гомология ; UEBA ; топологические дескрипторы ; кибербезопасность ; persistent homology ; topological descriptors ; cybersecurity |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 02.04.01 |
Группа специальностей ФГОС | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-3872 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать) |
Ключ записи | ru\spstu\vkr\25002 |
Дата создания записи | 03.08.2023 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В работе рассмотрены основные топологические представления, связанные с сопоставлением анализируемым наборам данных топологических пространств. Основное внимание уделено теории персистентных гомологий, которая лежит в основе топологического анализа данных. Описана процедура симплициальной фильтрации и ее связь с персистентными группами гомологий и модулем персистентности. Приведены основные конструкции теории персистентных гомологий, такие как диаграммы персистентности и штрих-коды. Рассмотрены основные методы векторизации диаграмм персистентности и показано, что реализация этих методов приводит к таким топологическим дескрипторам как кривые Бетти, кривые Эйлера, ландшафтные функции персистентности, образы персистентности. Приведены алгоритмы их построения, описаны основные свойства, приведены преимущества и недостатки при решении практических задач анализа данных и машинного обучения. В результате работы даны общие рекомендации по использованию топологических дескрипторов. Программная реализация выполнена с помощью библиотеки Giotto-tda на языке программирования Python. Приводятся результаты практической апробации применения топологических дескрипторов к данным системы мониторинга работы пользователей корпоративной сети.
The paper considers the basic topological notions related to the comparison of topological spaces to the analyzed data sets. The main attention is paid to the theory of persistent homologies, which is the basis of topological data analysis. The procedure of symplectic filtering and its relation to persistent homology groups and persistence module are described. The basic constructions of persistent homologies theory, such as persistence diagrams and barcodes, are given. Basic methods for vectorizing persistence diagrams are considered and it is shown that the implementation of these methods leads to such topological descriptors as Betti curves, Euler curves, persistence landscape functions, and persistence images. The algorithms for their construction are given, their main properties are described, advantages and disadvantages in solving practical problems of data analysis and machine learning are given. As a result, general recommendations on the use of topological descriptors are given. Software implementation is performed using Giotto-tda library in the Python programming language. The results of practical testing of topological descriptors application to the data of corporate network user activity monitoring system are given.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 55
За последние 30 дней: 2