Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Данная дипломная работа посвящена исследованию подходов к автоматизации процесса формирования выборки фишинговых сайтов и создания методов обнаружения на базе алгоритмов машинного обучения. Целью работы является разработка подхода к обнаружению фишинговых сайтов на базе динамически формируемой выборки. В дипломной работе предложена классификация современных фишинговых атак и подходов к обнаружению фишинговых сайтов. Также были исследованы существующие выборки фишинговых сайтов, используемые для создания методов обнаружения на базе алгоритмов машинного обучения. На базе выявленных недостатков существующих подходов был предложен новый подход к динамическому формированию выборки фишинговых сайтов. В работе описаны разработанные прототипы системы формирования динамической выборки и системы автоматизации создания бинарных классификаторов фишинговых сайтов. С использованием созданных прототипов были разработаны и опробованы методы обнаружения фишинговых сайтов на базе алгоритмов машинного обучения. Разработанные подходы могут применяться для разработки методов обнаружения фишинговых сайтов и их адаптации к новым классам фишинговых сайтов. Также был предложен подход к выявлению аномалий в выборке фишинговых сайтов на базе метода обучения с переносом. Предложенный подход может применяться для автоматизации выделения характерных признаков фишинговых сайтов на этапе разработки методов обнаружения на базе алгоритмов машинного обучения.
This work focuses on automating the process of phishing dataset generation and detection method creation. The goal of the given work is to develop a phishing site detection method based on machine learning algorithms via utilization of dynamically created dataset. A classification of existing phishing attacks and detection methods is proposed. During the research several deficiencies in the existing approaches to phishing website dataset creation were found. A new approach to dynamic dataset creation was proposed that corrects these deficiencies. Also, an approach to continuous phishing website classification model development was proposed that uses created dataset. For the proposed approaches a set of prototypes was developed. Using the developed prototypes, several classification models were trained. The proposed approaches may be used to create phishing site detection methods and adapt existing methods to new classes of phishing sites. An approach to anomaly detection in phishing site dataset based on transfer learning was proposed. This approach may be used to automate feature selection step of phishing site detection methods development.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All |
![]() |
||||
External organizations N2 | All |
![]() |
||||
External organizations N1 | All | |||||
Internet | Authorized users SPbPU |
![]() |
||||
Internet | Authorized users (not from SPbPU, N2) |
![]() |
||||
Internet | Authorized users (not from SPbPU, N1) | |||||
![]() |
Internet | Anonymous |
Usage statistics
|
Access count: 15
Last 30 days: 0 Detailed usage statistics |