С 17 марта 2020 г. для ресурсов (учебные, научные, материалы конференций, статьи из периодических изданий, авторефераты диссертаций, диссертации) ЭБ СПбПУ, обеспечивающих образовательный процесс, установлен особый режим использования. Обращаем внимание, что ВКР/НД не относятся к этой категории.

Details

Title: Семантический анализ текстовых данных для DLP-систем: выпускная квалификационная работа специалиста: 10.05.03 - Информационная безопасность автоматизированных систем ; 10.05.03_08 - Анализ безопасности информационных систем
Creators: Третников Андрей Александрович
Scientific adviser: Лаврова Дарья Сергеевна
Other creators: Резединова Евгения Юрьевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint: Санкт-Петербург, 2018
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: системы предотвращения утечек информации; утечки конфиденциальной информации; машинное обучение; рекуррентные нейронные сети; векторное представление текста; dlp; data leak prevention; data breach; machine learning; word embeddings; document embeddings; word2vec; doc2vec; lstm
Document type: Specialist graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 10.05.03
Speciality group (FGOS): 100000 - Информационная безопасность
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2018/vr/vr18-198
Rights: Свободный доступ из сети Интернет (чтение)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В работе предложен новый подход для предотвращения утечек конфиденциальной информации, основанный на применении технологии Word2Vec в связке с классификатором на основе нейронных LSTM-сетей. Его отличительной особенностью является учет семантики документов. Разработан прототип программы, внедрение которой позволит повысить качество классификации.

A new approach to prevent data leakage based on Word2Vec technology with LSTM-based classifier is proposed. Its distinctive feature is the accounting of document semantics. A prototype of the program was developed. Its implementation allows improving the quality of classification.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users Read
-> Internet Anonymous

Usage statistics

stat Access count: 161
Last 30 days: 0
Detailed usage statistics