Детальная информация

Название Применение искусственного интеллекта для выявления фишинговых веб-сайтов: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем» = Application of Artificial Intelligence for Detecting Phishing Websites
Авторы Кравцов Валерий Павлович
Научный руководитель Москвин Дмитрий Андреевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика фишинг ; искусственный интеллект ; машинное обучение ; стекинг ; ансамблевые методы ; классификация веб-сайтов ; информационная безопасность ; phishing ; artificial intelligence ; machine learning ; stacking ; ensemble methods ; website classification ; information security
Тип документа Выпускная квалификационная работа бакалавра
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 10.03.01
Группа специальностей ФГОС 100000 - Информационная безопасность
DOI 10.18720/SPBPU/3/2025/vr/vr25-865
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи ru\spstu\vkr\35739
Дата создания записи 30.07.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Целью работы является автоматизация выявления фишинговых веб-сайтов путём построения ансамблевой модели стекинга. Объектом исследования является фишинговые веб-сайты. Задачи, решаемые в ходе исследования: 1.Проанализировать архитектуру и методы функционирования фишинговых веб-сайтов, выявив их характерные признаки. 2.Оценить применимость методов машинного обучения для выявления фишинговых сайтов и определить наиболее эффективные модели. 3.Разработать и экспериментально оценить метод автоматической классификации веб-сайтов на фишинговые и легитимные с использованием ансамблевого подхода на основе стекинга. В ходе работы исследованы архитектура и особенности функционирования фишинговых веб-сайтов, а также современные алгоритмы машинного обучения для их автоматического выявления. Проведён сравнительный анализ эффективности различных моделей. В результате разработана программная система, состоящая из двух модулей: модуль извлечения признаков URL-адреса и модуль классификации с использованием ансамблевой модели стекинга. Эксперименты показали, что стекинг обеспечивает наивысшую точность (97,62%) по сравнению с отдельными моделями. Полученные результаты могут быть использованы для интеграции систем автоматического выявления фишинговых сайтов.

The purpose of the study is the automation of phishing-website detection by constructing an ensemble stacking model. The object of the research is phishing websites. The research set the following goals: 1.Analyze the architecture and operating methods of phishing websites, identifying their characteristic features. 2.Evaluate the applicability of machine-learning methods for detecting phishing sites and determine the most effective models. 3.Develop and experimentally evaluate a method for automatically classifying websites as phishing or legitimate using an ensemble stacking approach. During the work, the architecture and specific behaviour of phishing websites were investigated, and modern machine-learning algorithms for their automatic detection were analysed. A comparative evaluation of different models was carried out. As a result, a software system was developed consisting of two modules:  a URL-feature-extraction module and a classification module employing an ensemble stacking model. Experiments showed that the stacking ensemble achieved the highest accuracy (97.62 %) compared with individual models. The obtained results can be applied to the integration of automated phishing-site detection systems.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи
  • РЕФЕРАТ
  • ABSTRACT
  • Содержание
  • Определения, обозначения и сокращения
  • Введение
  • 1 Архитектура и методы работы фишинговых веб-сайтов
    • 1.1 Доменное имя и URL-адрес
    • 1.2 HTML-структура
    • 1.3 HTTPS-сертификаты
    • 1.4 API-запросы
    • 1.5 Использование JavaScript
    • 1.6 Методы взаимодействия с пользователем
    • 1.7 Выводы
  • 2 Методы машинного обучения для выявления фишинговых веб-сайтов
    • 2.1 Дерево решений
    • 2.2 Случайный лес
    • 2.3 Метод опорных векторов
    • 2.4 Градиентный бустинг (XGBoost, LightGBM, CatBoost)
    • 2.5 Логистическая регрессия
    • 2.6 Метод K-ближайших соседей
    • 2.7 Наивный байес
    • 2.8 Метод голосования (Voting)
    • 2.9 Стекинг (Stacking)
    • 2.10 Глубокое обучение (нейронные сети)
    • 2.11 Выводы
  • 3 Практическая часть: набор данных и реализация
    • 3.1 Результаты обучения моделей
    • 3.2 Выводы
  • Заключение
  • Список использованных источников
  • Приложение 1. Модуль онлайн проверки URL
  • Приложение 2. Модуль обучения моделей

Количество обращений: 11 
За последние 30 дней: 3

Подробная статистика