Details
| Title | Защита от утечек информации в технической и эксплуатационной документации: выпускная квалификационная работа специалиста: направление 10.05.04 «Информационно-аналитические системы безопасности» ; образовательная программа 10.05.04_01 «Автоматизация информационно-аналитической деятельности» = Data leakage protection in technical and operational documentation |
|---|---|
| Creators | Майоренко Анастасия Валерьевна |
| Scientific adviser | Зубков Евгений Альбертович |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2026 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | утечки информации ; техническая документация ; эксплуатационная документация ; документационный пакет ; ooxml ; pdf ; rule-based детекция ; ocr ; nlp ; стегоанализ ; data leakage ; technical documentation ; operational documentation ; document package ; rule-based detection ; steganalysis |
| Document type | Specialist graduation qualification work |
| Language | Russian |
| Level of education | Specialist |
| Speciality code (FGOS) | 10.05.04 |
| Speciality group (FGOS) | 100000 - Информационная безопасность |
| DOI | 10.18720/SPBPU/3/2026/vr/vr26-417 |
| Rights | Доступ по паролю из сети Интернет (чтение) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\40260 |
| Record create date | 4/20/2026 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
Цель работы — повышение уровня защищённости технической и эксплуатационной документации за счёт автоматизированного выявления конфиденциальной информации с учётом особенностей структуры форматов. Объект исследования — цифровые документы и документационные пакеты (архивы, вложения, встроенные ресурсы), используемые при подготовке, хранении и передаче документации. Задачи, решаемые в ходе исследования: 1. Исследование типов и особенностей технической и эксплуатационной документации. 2. Анализ угроз и сценариев утечек информации, связанных с документами и их структурой. 3. Программная реализация прототипа системы обнаружения и аналитики чувствительных данных в документационном пакете. 4. Тестирование разработанного прототипа и оценка его эффективности. Методология: автоматическая обработка документов и архивов (извлечение содержимого/метаданных, проверка вложений, поиск по правилам с OCR/NLP и анализом изображений). Испытания на синтетическом и реальном наборах подтвердили устойчивость и выявили недостатки. Решение подходит для предварительного контроля документации. Использовались/разрабатывались: Python, Docker Compose, микросервисы: Redis (ARQ), PostgreSQL, MinIO (S3), Tesseract OCR, Natasha (NER), Prometheus, Jaeger, Grafana.
Increasing the level of security of technical and operational documentation through automated identification of confidential information, taking into account the specific structure of the formats. The object of the study is digital documents and document packages (archives, attachments, embedded resources) used in the preparation, storage, and transfer of documentation. Research objectives: 1. Research of types and features of technical and operational documentation. 2. Analysis of threats and scenarios of information leaks related to documents and their structure. 3. Software implementation of a prototype system for detecting and analyzing important data in a documentary package. 4. Testing the developed prototype and evaluating its effectiveness. Methodology: automated processing of documents and archives (content/metadata extraction, attachment inspection, rule-based search with OCR/NLP and image analysis). Tests on synthetic and real datasets confirmed robustness and revealed limitations. The solution is suitable for preliminary control in systems/document gateways with flexible rule tuning for a specific organization. Used/developed: Python, Docker Compose, microservices: Redis (ARQ), PostgreSQL, MinIO (S3), Tesseract OCR, Natasha (NER), Prometheus, Jaeger, Grafana.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|