Details
Title | Предотвращение утечек конфиденциальных данных с помощью легковесных больших языковых моделей: выпускная квалификационная работа специалиста: направление 10.05.04 «Информационно-аналитические системы безопасности» ; образовательная программа 10.05.04_01 «Автоматизация информационно-аналитической деятельности» |
---|---|
Creators | Чеченев Александр Дмитриевич |
Scientific adviser | Дахнович Андрей Дмитриевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | конфиденицальные данные ; система предотвращения утечек ; большая языковая модель ; qwen ; fine-tunning ; confidential data ; data leak prevention system ; large language model |
Document type | Specialist graduation qualification work |
File type | |
Language | Russian |
Level of education | Specialist |
Speciality code (FGOS) | 10.05.04 |
Speciality group (FGOS) | 100000 - Информационная безопасность |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-61 |
Rights | Доступ по паролю из сети Интернет (чтение, печать) |
Additionally | New arrival |
Record key | ru\spstu\vkr\34241 |
Record create date | 2/27/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Целью работы является разработка метода предотвращения утечек конфиденциальных данных с помощью легковесной большой языковой модели. Задачи, решаемые в ходе исследования: 1. Исследовать легковесные LLM с целью выявления конфиденциальной информации и обоснованного выбора наиболее подходящей модели для последующего улучшения. 2. Повысить точность работы выбранной LLM. 3. Разработать прототип системы предотвращения утечек для тестирования выбранной LLM. 4. Провести оценку разработанного метода. В ходе данной ВКР был разработан метод предотвращения утечек конфиденциальных данных из контура организации на основе легковесной большой языковой модели. Архитектура, модель и параметры системы выбирались исходя из актуальных исследований 2023–2024 года. Система была протестирована на практике и показала результат лучше или на уровне решения, которое используется российскими коммерческими компаниями. Результаты данной ВКР будут использованы в разработке программного обеспечения, которое в дальнейшем будет предлагаться российским компаниям для уменьшения количества утечек.
The purpose of this work is to develop a method for preventing confidential data leaks using a lightweight large language model. Research objectives: 1. Study lightweight LLMs to identify confidential information and justify the choice of the most suitable model for further improvement. 2. Improve the accuracy of the selected LLM. 3. Develop a prototype of a data leak prevention system to test the selected LLM. 4. Evaluate the developed method. As part of this final qualification work, a method was developed to prevent confidential data leaks from an organization’s network based on a lightweight large language model. The systems architecture, model, and parameters were chosen based on the latest research from 2023–2024. The system was tested in practice and demonstrated performance that was either better than or on par with solutions currently used by Russian commercial companies. The results of this work will be utilized in the development of software that will be offered to Russian companies to reduce the number of data leaks.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0