Details

Title Применение искусственного интеллекта для выявления фишинговых веб-сайтов: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Creators Кравцов Валерий Павлович
Scientific adviser Москвин Дмитрий Андреевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects фишинг ; искусственный интеллект ; машинное обучение ; стекинг ; ансамблевые методы ; классификация веб-сайтов ; информационная безопасность ; phishing ; artificial intelligence ; machine learning ; stacking ; ensemble methods ; website classification ; information security
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 10.03.01
Speciality group (FGOS) 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2025/vr/vr25-865
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\35739
Record create date 7/30/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Целью работы является автоматизация выявления фишинговых веб-сайтов путём построения ансамблевой модели стекинга. Объектом исследования является фишинговые веб-сайты. Задачи, решаемые в ходе исследования: 1.Проанализировать архитектуру и методы функционирования фишинговых веб-сайтов, выявив их характерные признаки. 2.Оценить применимость методов машинного обучения для выявления фишинговых сайтов и определить наиболее эффективные модели. 3.Разработать и экспериментально оценить метод автоматической классификации веб-сайтов на фишинговые и легитимные с использованием ансамблевого подхода на основе стекинга. В ходе работы исследованы архитектура и особенности функционирования фишинговых веб-сайтов, а также современные алгоритмы машинного обучения для их автоматического выявления. Проведён сравнительный анализ эффективности различных моделей. В результате разработана программная система, состоящая из двух модулей: модуль извлечения признаков URL-адреса и модуль классификации с использованием ансамблевой модели стекинга. Эксперименты показали, что стекинг обеспечивает наивысшую точность (97,62%) по сравнению с отдельными моделями. Полученные результаты могут быть использованы для интеграции систем автоматического выявления фишинговых сайтов.

The purpose of the study is the automation of phishing-website detection by constructing an ensemble stacking model. The object of the research is phishing websites. The research set the following goals: 1.Analyze the architecture and operating methods of phishing websites, identifying their characteristic features. 2.Evaluate the applicability of machine-learning methods for detecting phishing sites and determine the most effective models. 3.Develop and experimentally evaluate a method for automatically classifying websites as phishing or legitimate using an ensemble stacking approach. During the work, the architecture and specific behaviour of phishing websites were investigated, and modern machine-learning algorithms for their automatic detection were analysed. A comparative evaluation of different models was carried out. As a result, a software system was developed consisting of two modules:  a URL-feature-extraction module and a classification module employing an ensemble stacking model. Experiments showed that the stacking ensemble achieved the highest accuracy (97.62 %) compared with individual models. The obtained results can be applied to the integration of automated phishing-site detection systems.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • РЕФЕРАТ
  • ABSTRACT
  • Содержание
  • Определения, обозначения и сокращения
  • Введение
  • 1 Архитектура и методы работы фишинговых веб-сайтов
    • 1.1 Доменное имя и URL-адрес
    • 1.2 HTML-структура
    • 1.3 HTTPS-сертификаты
    • 1.4 API-запросы
    • 1.5 Использование JavaScript
    • 1.6 Методы взаимодействия с пользователем
    • 1.7 Выводы
  • 2 Методы машинного обучения для выявления фишинговых веб-сайтов
    • 2.1 Дерево решений
    • 2.2 Случайный лес
    • 2.3 Метод опорных векторов
    • 2.4 Градиентный бустинг (XGBoost, LightGBM, CatBoost)
    • 2.5 Логистическая регрессия
    • 2.6 Метод K-ближайших соседей
    • 2.7 Наивный байес
    • 2.8 Метод голосования (Voting)
    • 2.9 Стекинг (Stacking)
    • 2.10 Глубокое обучение (нейронные сети)
    • 2.11 Выводы
  • 3 Практическая часть: набор данных и реализация
    • 3.1 Результаты обучения моделей
    • 3.2 Выводы
  • Заключение
  • Список использованных источников
  • Приложение 1. Модуль онлайн проверки URL
  • Приложение 2. Модуль обучения моделей

Access count: 0 
Last 30 days: 0

Detailed usage statistics