Детальная информация

Название Предотвращение утечек конфиденциальных данных с помощью легковесных больших языковых моделей: выпускная квалификационная работа специалиста: направление 10.05.04 «Информационно-аналитические системы безопасности» ; образовательная программа 10.05.04_01 «Автоматизация информационно-аналитической деятельности»
Авторы Чеченев Александр Дмитриевич
Научный руководитель Дахнович Андрей Дмитриевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика конфиденицальные данные ; система предотвращения утечек ; большая языковая модель ; qwen ; fine-tunning ; confidential data ; data leak prevention system ; large language model
Тип документа Выпускная квалификационная работа специалиста
Тип файла PDF
Язык Русский
Уровень высшего образования Специалитет
Код специальности ФГОС 10.05.04
Группа специальностей ФГОС 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2025/vr/vr25-61
Права доступа Доступ по паролю из сети Интернет (чтение, печать)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\34241
Дата создания записи 27.02.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Целью работы является разработка метода предотвращения утечек конфиденциальных данных с помощью легковесной большой языковой модели. Задачи, решаемые в ходе исследования: 1. Исследовать легковесные LLM с целью выявления конфиденциальной информации и обоснованного выбора наиболее подходящей модели для последующего улучшения. 2. Повысить точность работы выбранной LLM. 3. Разработать прототип системы предотвращения утечек для тестирования выбранной LLM. 4. Провести оценку разработанного метода. В ходе данной ВКР был разработан метод предотвращения утечек конфиденциальных данных из контура организации на основе легковесной большой языковой модели. Архитектура, модель и параметры системы выбирались исходя из актуальных исследований 2023–2024 года. Система была протестирована на практике и показала результат лучше или на уровне решения, которое используется российскими коммерческими компаниями. Результаты данной ВКР будут использованы в разработке программного обеспечения, которое в дальнейшем будет предлагаться российским компаниям для уменьшения количества утечек.

The purpose of this work is to develop a method for preventing confidential data leaks using a lightweight large language model. Research objectives: 1. Study lightweight LLMs to identify confidential information and justify the choice of the most suitable model for further improvement. 2. Improve the accuracy of the selected LLM. 3. Develop a prototype of a data leak prevention system to test the selected LLM. 4. Evaluate the developed method. As part of this final qualification work, a method was developed to prevent confidential data leaks from an organization’s network based on a lightweight large language model. The systems architecture, model, and parameters were chosen based on the latest research from 2023–2024. The system was tested in practice and demonstrated performance that was either better than or on par with solutions currently used by Russian commercial companies. The results of this work will be utilized in the development of software that will be offered to Russian companies to reduce the number of data leaks.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика