Разработка архитектуры фреймворка защищённого озера больших данных: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»

Муратов, Симар Юсупович

Вход в систему

Детальная информация

	Таблица	Карточка	RUSMARC

Название:	Разработка архитектуры фреймворка защищённого озера больших данных: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Авторы:	Муратов Симар Юсупович
Научный руководитель:	Лукашин Алексей Андреевич
Организация:	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения:	Санкт-Петербург, 2022
Коллекция:	Выпускные квалификационные работы; Общая коллекция
Тематика:	Информация — Защита; Базы данных; большие данные; облачные вычисления; озеро данных; кибербезопасность; big data; cloud computing; data lake; cybersecurity
УДК:	004.056; 004.6
Тип документа:	Выпускная квалификационная работа магистра
Тип файла:	PDF
Язык:	Русский
Уровень высшего образования:	Магистратура
Код специальности ФГОС:	02.04.01
Группа специальностей ФГОС:	020000 - Компьютерные и информационные науки
DOI:	10.18720/SPBPU/3/2023/vr/vr23-508
Права доступа:	Доступ по паролю из сети Интернет (чтение)
Ключ записи:	ru\spstu\vkr\20806

Разрешенные действия: –

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной выпускной квалификационной работе представлена разработка архитектуры фреймворка защищённого озера больших данных. За основу взят Data Lake Architecture Framework (DLAF), разработанный исследователями данных Штутгардского Университета. В работе исследована методология DLAF, его аспекты и из взаимодействия. Разработка средства обеспечения информационной безопасности озера данных на архитектурном уровне потребовала тщательного отбора сценариев атак и моделей безопасности. Отбор проводился с учётом таких главных отличительных черт озера данных, как возможности загрузки, обработки и выгрузки данных абсолютно любого типа, а также взаимодействие с любым источником данных. Выбранные модели безопасности в своей основе состоят из ролевых или атрибутных политик. Данные модели претерпели модификации под нужды озера данных. Обеспечение защиты данных возложено на два компонента: Global Monitoring Tool и Check Sum Controller. Данные компоненты включены в политики модели безопасности на этапе проектирования. Первый компонент реализован в виде композиции моделей машинного обучения и нуждается в предварительном обучении. Он отвечает за мониторинг всех операций озера данных и их классификации на безопасные и вредоносные. Второй компонент обрабатывает любое взаимодействие с контрольной суммой файлового объекта в течение всего пребывания в озере данных. Приведённый в работе инструментальный аудит информационной безопасности дал объективные оценки разработанного решения и рекомендации по выбору моделей безопасности.

This final qualification paper presents the development of a protected big data lake framework architecture. It is based on the Data Lake Architecture Framework (DLAF) developed by data scientists at the University of Stuttgart. The paper investigates the DLAF methodology, its aspects and from interactions. Developing a data lake information security tool at the architectural level required a careful selection of attack scenarios and security models. The selection was made taking into account the main features of the data lake, such as the ability to download, process and upload data of absolutely any type, as well as interaction with any data source. The selected security models consist fundamentally of role or attribute policies. These models have undergone modifications for the needs of the data lake. Data protection is assigned to two components: Global Monitoring Tool and Check Sum Controller. These components are included in the security model policies at the design stage. The first component is implemented as a composition of machine learning models and needs to be pre-trained. It is responsible for monitoring all data lake operations and classifying them into safe and malicious ones. The second component handles any interaction with the checksum of the file object during the entire stay in the data lake. The information security instrumental audit presented in this paper provided objective evaluations of the developed solution and recommendations for security model selection.

Права на использование объекта хранения

	Место доступа		Группа пользователей		Действие
	Локальная сеть ИБК СПбПУ		Все
	Интернет		Авторизованные пользователи СПбПУ
	Интернет		Анонимные пользователи

Статистика использования

Количество обращений: 18
За последние 30 дней: 0
Подробная статистика