Details

Title Защита от утечек информации в технической и эксплуатационной документации: выпускная квалификационная работа специалиста: направление 10.05.04 «Информационно-аналитические системы безопасности» ; образовательная программа 10.05.04_01 «Автоматизация информационно-аналитической деятельности» = Data leakage protection in technical and operational documentation
Creators Майоренко Анастасия Валерьевна
Scientific adviser Зубков Евгений Альбертович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2026
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects утечки информации ; техническая документация ; эксплуатационная документация ; документационный пакет ; ooxml ; pdf ; rule-based детекция ; ocr ; nlp ; стегоанализ ; data leakage ; technical documentation ; operational documentation ; document package ; rule-based detection ; steganalysis
Document type Specialist graduation qualification work
Language Russian
Level of education Specialist
Speciality code (FGOS) 10.05.04
Speciality group (FGOS) 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2026/vr/vr26-417
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\40260
Record create date 4/20/2026

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Цель работы — повышение уровня защищённости технической и эксплуатационной документации за счёт автоматизированного выявления конфиденциальной информации с учётом особенностей структуры форматов. Объект исследования — цифровые документы и документационные пакеты (архивы, вложения, встроенные ресурсы), используемые при подготовке, хранении и передаче документации. Задачи, решаемые в ходе исследования: 1. Исследование типов и особенностей технической и эксплуатационной документации. 2. Анализ угроз и сценариев утечек информации, связанных с документами и их структурой. 3. Программная реализация прототипа системы обнаружения и аналитики чувствительных данных в документационном пакете. 4. Тестирование разработанного прототипа и оценка его эффективности. Методология: автоматическая обработка документов и архивов (извлечение содержимого/метаданных, проверка вложений, поиск по правилам с OCR/NLP и анализом изображений). Испытания на синтетическом и реальном наборах подтвердили устойчивость и выявили недостатки. Решение подходит для предварительного контроля документации. Использовались/разрабатывались: Python, Docker Compose, микросервисы: Redis (ARQ), PostgreSQL, MinIO (S3), Tesseract OCR, Natasha (NER), Prometheus, Jaeger, Grafana.

Increasing the level of security of technical and operational documentation through automated identification of confidential information, taking into account the specific structure of the formats. The object of the study is digital documents and document packages (archives, attachments, embedded resources) used in the preparation, storage, and transfer of documentation. Research objectives: 1. Research of types and features of technical and operational documentation. 2. Analysis of threats and scenarios of information leaks related to documents and their structure. 3. Software implementation of a prototype system for detecting and analyzing important data in a documentary package. 4. Testing the developed prototype and evaluating its effectiveness. Methodology: automated processing of documents and archives (content/metadata extraction, attachment inspection, rule-based search with OCR/NLP and image analysis). Tests on synthetic and real datasets confirmed robustness and revealed limitations. The solution is suitable for preliminary control in systems/document gateways with flexible rule tuning for a specific organization. Used/developed: Python, Docker Compose, microservices: Redis (ARQ), PostgreSQL, MinIO (S3), Tesseract OCR, Natasha (NER), Prometheus, Jaeger, Grafana.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous
...