Применение искусственного интеллекта для выявления фишинговых веб-сайтов: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»

Кравцов, Валерий Павлович

Детальная информация

Название	Применение искусственного интеллекта для выявления фишинговых веб-сайтов: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем»
Авторы	Кравцов Валерий Павлович
Научный руководитель	Москвин Дмитрий Андреевич
Организация	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения	Санкт-Петербург, 2025
Коллекция	Выпускные квалификационные работы ; Общая коллекция
Тематика	фишинг ; искусственный интеллект ; машинное обучение ; стекинг ; ансамблевые методы ; классификация веб-сайтов ; информационная безопасность ; phishing ; artificial intelligence ; machine learning ; stacking ; ensemble methods ; website classification ; information security
Тип документа	Выпускная квалификационная работа бакалавра
Тип файла	PDF
Язык	Русский
Уровень высшего образования	Бакалавриат
Код специальности ФГОС	10.03.01
Группа специальностей ФГОС	100000 - Информационная безопасность
DOI	10.18720/SPBPU/3/2025/vr/vr25-865
Права доступа	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно	Новинка
Ключ записи	ru\spstu\vkr\35739
Дата создания записи	30.07.2025

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

Целью работы является автоматизация выявления фишинговых веб-сайтов путём построения ансамблевой модели стекинга. Объектом исследования является фишинговые веб-сайты. Задачи, решаемые в ходе исследования: 1.Проанализировать архитектуру и методы функционирования фишинговых веб-сайтов, выявив их характерные признаки. 2.Оценить применимость методов машинного обучения для выявления фишинговых сайтов и определить наиболее эффективные модели. 3.Разработать и экспериментально оценить метод автоматической классификации веб-сайтов на фишинговые и легитимные с использованием ансамблевого подхода на основе стекинга. В ходе работы исследованы архитектура и особенности функционирования фишинговых веб-сайтов, а также современные алгоритмы машинного обучения для их автоматического выявления. Проведён сравнительный анализ эффективности различных моделей. В результате разработана программная система, состоящая из двух модулей: модуль извлечения признаков URL-адреса и модуль классификации с использованием ансамблевой модели стекинга. Эксперименты показали, что стекинг обеспечивает наивысшую точность (97,62%) по сравнению с отдельными моделями. Полученные результаты могут быть использованы для интеграции систем автоматического выявления фишинговых сайтов.

The purpose of the study is the automation of phishing-website detection by constructing an ensemble stacking model. The object of the research is phishing websites. The research set the following goals: 1.Analyze the architecture and operating methods of phishing websites, identifying their characteristic features. 2.Evaluate the applicability of machine-learning methods for detecting phishing sites and determine the most effective models. 3.Develop and experimentally evaluate a method for automatically classifying websites as phishing or legitimate using an ensemble stacking approach. During the work, the architecture and specific behaviour of phishing websites were investigated, and modern machine-learning algorithms for their automatic detection were analysed. A comparative evaluation of different models was carried out. As a result, a software system was developed consisting of two modules: a URL-feature-extraction module and a classification module employing an ensemble stacking model. Experiments showed that the stacking ensemble achieved the highest accuracy (97.62 %) compared with individual models. The obtained results can be applied to the integration of automated phishing-site detection systems.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

РЕФЕРАТ
ABSTRACT
Содержание
Определения, обозначения и сокращения
Введение
1 Архитектура и методы работы фишинговых веб-сайтов
- 1.1 Доменное имя и URL-адрес
- 1.2 HTML-структура
- 1.3 HTTPS-сертификаты
- 1.4 API-запросы
- 1.5 Использование JavaScript
- 1.6 Методы взаимодействия с пользователем
- 1.7 Выводы
2 Методы машинного обучения для выявления фишинговых веб-сайтов
- 2.1 Дерево решений
- 2.2 Случайный лес
- 2.3 Метод опорных векторов
- 2.4 Градиентный бустинг (XGBoost, LightGBM, CatBoost)
- 2.5 Логистическая регрессия
- 2.6 Метод K-ближайших соседей
- 2.7 Наивный байес
- 2.8 Метод голосования (Voting)
- 2.9 Стекинг (Stacking)
- 2.10 Глубокое обучение (нейронные сети)
- 2.11 Выводы
3 Практическая часть: набор данных и реализация
- 3.1 Результаты обучения моделей
- 3.2 Выводы
Заключение
Список использованных источников
Приложение 1. Модуль онлайн проверки URL
Приложение 2. Модуль обучения моделей

Количество обращений: 0
За последние 30 дней: 0

Подробная статистика