Details

Title: Подход к динамическому формированию выборки для использования методами машинного обучения в целях обнаружения фишинговых сайтов: выпускная квалификационная работа специалиста: направление 10.05.01 «Компьютерная безопасность» ; образовательная программа 10.05.01_02 «Математические методы защиты информации»
Creators: Кубрин Георгий Сергеевич
Scientific adviser: Иванов Денис Вадимович
Other creators: Попова Елена Александровна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт кибербезопасности и защиты информации
Imprint: Санкт-Петербург, 2021
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Нейронные сети; Искусственный интеллект; обнаружение фишинговых сайтов; классификация; кластеризация; выбор характерных параметров фишинговых сайтов; phishing site detection; classification; clustering; phishing site feature selection
UDC: 004.032.26; 004.8
Document type: Specialist graduation qualification work
File type: PDF
Language: Russian
Level of education: Specialist
Speciality code (FGOS): 10.05.01
Speciality group (FGOS): 100000 - Информационная безопасность
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-146
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\15383

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Данная дипломная работа посвящена исследованию подходов к автоматизации процесса формирования выборки фишинговых сайтов и создания методов обнаружения на базе алгоритмов машинного обучения. Целью работы является разработка подхода к обнаружению фишинговых сайтов на базе динамически формируемой выборки. В дипломной работе предложена классификация современных фишинговых атак и подходов к обнаружению фишинговых сайтов. Также были исследованы существующие выборки фишинговых сайтов, используемые для создания методов обнаружения на базе алгоритмов машинного обучения. На базе выявленных недостатков существующих подходов был предложен новый подход к динамическому формированию выборки фишинговых сайтов. В работе описаны разработанные прототипы системы формирования динамической выборки и системы автоматизации создания бинарных классификаторов фишинговых сайтов. С использованием созданных прототипов были разработаны и опробованы методы обнаружения фишинговых сайтов на базе алгоритмов машинного обучения. Разработанные подходы могут применяться для разработки методов обнаружения фишинговых сайтов и их адаптации к новым классам фишинговых сайтов. Также был предложен подход к выявлению аномалий в выборке фишинговых сайтов на базе метода обучения с переносом. Предложенный подход может применяться для автоматизации выделения характерных признаков фишинговых сайтов на этапе разработки методов обнаружения на базе алгоритмов машинного обучения.

This work focuses on automating the process of phishing dataset generation and detection method creation. The goal of the given work is to develop a phishing site detection method based on machine learning algorithms via utilization of dynamically created dataset. A classification of existing phishing attacks and detection methods is proposed. During the research several deficiencies in the existing approaches to phishing website dataset creation were found. A new approach to dynamic dataset creation was proposed that corrects these deficiencies. Also, an approach to continuous phishing website classification model development was proposed that uses created dataset. For the proposed approaches a set of prototypes was developed. Using the developed prototypes, several classification models were trained. The proposed approaches may be used to create phishing site detection methods and adapt existing methods to new classes of phishing sites. An approach to anomaly detection in phishing site dataset based on transfer learning was proposed. This approach may be used to automate feature selection step of phishing site detection methods development.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
External organizations N2 All Read
External organizations N1 All
Internet Authorized users SPbPU Read
Internet Authorized users (not from SPbPU, N2) Read
Internet Authorized users (not from SPbPU, N1)
-> Internet Anonymous

Usage statistics

stat Access count: 7
Last 30 days: 2
Detailed usage statistics