Детальная информация

Название: Система автоматизированного выявления фишинговых сайтов: выпускная квалификационная работа бакалавра: 01.03.02 - Прикладная математика и информатика ; 01.03.02_03 - Математическое и информационное обеспечение экономической деятельности
Авторы: Рыбальченко Сергей Андреевич
Научный руководитель: Новиков Федор Александрович
Другие авторы: Арефьева Людмила Анатольевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2019
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: фишинг; киберсквоттинг; кредитная организация; доменное имя; расстояние Левенштейна; лексическая связь; компьютерное зрение; машинное зрение; OpenCV; распознавание; наука о данных; машинное обучение; нейронные сети; сверточные нейронные сети; глубокое обучение; FastCNN; phishing; cybersquatting; credit institution; domain name; Levenshtein distance; lexical communication; computer vision; machine vision; recognition; data science; machine learning; neural networks; convolutional neural networks; deep learning
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 01.03.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-3924
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\3308

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Настоящая работа посвящена созданию системы автоматизированного выявления фишинговых сайтов. Актуальность работы заключается в том, что, на момент публикации этой работы, существующие методы обнаружения фишинговых ресурсов устаревают, в то время как продвинутые методы машинного обучения развиваются и достигают высокой точности достаточной для решения прикладных задач. Проведен анализ основных методов фишинга, а также алгоритмов по их распознаванию: HTML-парсинг страниц, анализ страниц методами компьютерного зрения, а также анализ страниц сверточной нейронной сетью. Разработан программный инструмент, позволяющий в оперативном режиме выявлять фишинговые и другие подозрительные сайты. На основе моделирования и реализации представленных алгоритмов произведена оценка результатов работы системы. Также проводилось сравнительное исследование, между алгоритмами по распознаванию образов на странице. Глава 1 содержит классификацию фишинговых ресурсов, обзор алгоритма получения данных, основные критерии по подозрению в фишинге, а также социальная значимость выявления фишинга. В главе 2 представлены алгоритмы распознавания фишинговых сайтов: анализ текстового содержания страниц, основы распознавания объектов на изображении, базовое понимание об основах машинного обучения, структура сверточных нейронных сетей, а также описаны основные методы, которые принимают участие в проводимом исследовании. В главе 3 описано проводимое сравнительное исследование. В главе Заключение сделаны выводы.

This paper is devoted to creating a system for automated detection of phishing sites. The relevance of the work lies in the fact that, at the time of publication of this work, existing methods for detecting phishing resources become obsolete, while advanced methods of machine learning are developing and achieve high accuracy sufficient to solve applied problems. The analysis of the main methods of phishing, as well as algorithms for their recognition: HTML-page parsing, page analysis by computer vision methods, as well as page analysis using a convolutional neural network. A software tool has been developed that allows online detection of phishing and other suspicious sites. Based on the simulation and implementation of the presented algorithms, the results of the system were evaluated. Also conducted a comparative study between the algorithms for pattern recognition on the page. Chapter 1 contains a classification of phishing resources, an overview of the algorithm for obtaining data, the main criteria for suspecting phishing, and the social significance of identifying phishing. Chapter 2 presents algorithms for recognizing phishing sites: analyzing the textual content of pages, the basics of recognizing objects in an image, a basic understanding of the basics of machine learning, the structure of convolutional neural networks, and describes the main methods that are involved in the study. Chapter 3 describes the ongoing comparative study. Conclusions are drawn in the chapter.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 82
За последние 30 дней: 0
Подробная статистика