Details

Title: Система автоматизированного выявления фишинговых сайтов: выпускная квалификационная работа бакалавра: 01.03.02 - Прикладная математика и информатика ; 01.03.02_03 - Математическое и информационное обеспечение экономической деятельности
Creators: Рыбальченко Сергей Андреевич
Scientific adviser: Новиков Федор Александрович
Other creators: Арефьева Людмила Анатольевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2019
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: фишинг; киберсквоттинг; кредитная организация; доменное имя; расстояние Левенштейна; лексическая связь; компьютерное зрение; машинное зрение; OpenCV; распознавание; наука о данных; машинное обучение; нейронные сети; сверточные нейронные сети; глубокое обучение; FastCNN; phishing; cybersquatting; credit institution; domain name; Levenshtein distance; lexical communication; computer vision; machine vision; recognition; data science; machine learning; neural networks; convolutional neural networks; deep learning
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 01.03.02
Speciality group (FGOS): 010000 - Математика и механика
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-3924
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\3308

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Настоящая работа посвящена созданию системы автоматизированного выявления фишинговых сайтов. Актуальность работы заключается в том, что, на момент публикации этой работы, существующие методы обнаружения фишинговых ресурсов устаревают, в то время как продвинутые методы машинного обучения развиваются и достигают высокой точности достаточной для решения прикладных задач. Проведен анализ основных методов фишинга, а также алгоритмов по их распознаванию: HTML-парсинг страниц, анализ страниц методами компьютерного зрения, а также анализ страниц сверточной нейронной сетью. Разработан программный инструмент, позволяющий в оперативном режиме выявлять фишинговые и другие подозрительные сайты. На основе моделирования и реализации представленных алгоритмов произведена оценка результатов работы системы. Также проводилось сравнительное исследование, между алгоритмами по распознаванию образов на странице. Глава 1 содержит классификацию фишинговых ресурсов, обзор алгоритма получения данных, основные критерии по подозрению в фишинге, а также социальная значимость выявления фишинга. В главе 2 представлены алгоритмы распознавания фишинговых сайтов: анализ текстового содержания страниц, основы распознавания объектов на изображении, базовое понимание об основах машинного обучения, структура сверточных нейронных сетей, а также описаны основные методы, которые принимают участие в проводимом исследовании. В главе 3 описано проводимое сравнительное исследование. В главе Заключение сделаны выводы.

This paper is devoted to creating a system for automated detection of phishing sites. The relevance of the work lies in the fact that, at the time of publication of this work, existing methods for detecting phishing resources become obsolete, while advanced methods of machine learning are developing and achieve high accuracy sufficient to solve applied problems. The analysis of the main methods of phishing, as well as algorithms for their recognition: HTML-page parsing, page analysis by computer vision methods, as well as page analysis using a convolutional neural network. A software tool has been developed that allows online detection of phishing and other suspicious sites. Based on the simulation and implementation of the presented algorithms, the results of the system were evaluated. Also conducted a comparative study between the algorithms for pattern recognition on the page. Chapter 1 contains a classification of phishing resources, an overview of the algorithm for obtaining data, the main criteria for suspecting phishing, and the social significance of identifying phishing. Chapter 2 presents algorithms for recognizing phishing sites: analyzing the textual content of pages, the basics of recognizing objects in an image, a basic understanding of the basics of machine learning, the structure of convolutional neural networks, and describes the main methods that are involved in the study. Chapter 3 describes the ongoing comparative study. Conclusions are drawn in the chapter.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 85
Last 30 days: 0
Detailed usage statistics