Обнаружение вредоносных PDF-файлов с помощью методов машинного обучения: выпускная квалификационная работа магистра: направление 10.04.01 «Информационная безопасность» ; образовательная программа 10.04.01_01 «Математические методы компьютерной безопасности»

Абуляев, Рашит Рафаэлович

Details

	Table	Card	RUSMARC

Title:	Обнаружение вредоносных PDF-файлов с помощью методов машинного обучения: выпускная квалификационная работа магистра: направление 10.04.01 «Информационная безопасность» ; образовательная программа 10.04.01_01 «Математические методы компьютерной безопасности»
Creators:	Абуляев Рашит Рафаэлович
Scientific adviser:	Семенов Павел Олегович
Organization:	Санкт-Петербургский политехнический университет Петра Великого. Институт кибербезопасности и защиты информации
Imprint:	Санкт-Петербург, 2022
Collection:	Выпускные квалификационные работы; Общая коллекция
Subjects:	Машинное обучение; Файлы; деревья решений; decision trees
UDC:	004.85; 004.63
Document type:	Master graduation qualification work
File type:	PDF
Language:	Russian
Level of education:	Master
Speciality code (FGOS):	10.04.01
Speciality group (FGOS):	100000 - Информационная безопасность
DOI:	10.18720/SPBPU/3/2023/vr/vr23-471
Rights:	Доступ по паролю из сети Интернет (чтение)
Record key:	ru\spstu\vkr\20738

Allowed Actions: –

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Обнаружение вредоносных PDF-файлов с помощью методов машинного обучения».Целью работы является повышение эффективности обнаружения вредоносных PDF с помощью методов машинного обучения. Предметом исследования являются модели, построенные для обнаружения вредоносных PDF. Задачи, решаемые в ходе исследования:Анализ структуры и механизмов работы вредоносных PDF файлов. Анализ применимости методов машинного обучения для обнаружения вредоносных PDF файлов. Формирование базы данных для проведения исследования. Разработка программного прототипа для выявления вредоносных PDF файлов с помощью методов машинного обучения. Оценка эффективности обнаружения вредоносных PDF файлов с помощью методов машинного обучения. В ходе работы были исследованы структура и механизмы работы вредоносных PDF файлов. Проведен анализ применимости методов машинного обучения для обнаружения вредоносных PDF файлов и сформирована сбалансированная база данных для проведения исследования. В результате работы было разработан прототип для выявления вредоносных PDF файлов, была продемонстрирована эффективность средства. Был сделан вывод, что алгоритм случайного леса лучше других алгоритмов подходит для задачи классификации вредоносных PDF файлов.

The topic of the graduate qualification work is «Detection of malicious PDF files using machine learning algorithms». The purpose of the study is increasing efficiency of malicious PDF files detection using machine learning algorithms. The subject of the work is models which build to detect malicious PDF files. The research set the following goals: Analysis of structure and working mechanisms of malicious PDF files. Applicability analysis of machine learning algorithms to malicious PDF files detection. Dataset building for research purposes. Malicious PDF files detection prototype software development using machine learning algorithms. Measuring the efficiency of malicious PDF files detection using machine learning algorithms. During the work analysis of structure and working mechanisms of malicious PDF files was done. Applicability analysis of machine learning algorithms to malicious PDF files detection was made and dataset for research purposes was build. The work resulted in development of the prototype which used for malicious PDF files detection and his efficiency was demonstrated. The conclusion that random forest algorithm is a good fit for malicious PDF files detection was made.

Document access rights

	Network		User group		Action
	ILC SPbPU Local Network		All
	Internet		Authorized users SPbPU
	Internet		Anonymous

Usage statistics

Access count: 13
Last 30 days: 0
Detailed usage statistics