Details
Title | Применение искусственного интеллекта для выявления фишинговых веб-сайтов: выпускная квалификационная работа бакалавра: направление 10.03.01 «Информационная безопасность» ; образовательная программа 10.03.01_03 «Безопасность компьютерных систем» |
---|---|
Creators | Кравцов Валерий Павлович |
Scientific adviser | Москвин Дмитрий Андреевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | фишинг ; искусственный интеллект ; машинное обучение ; стекинг ; ансамблевые методы ; классификация веб-сайтов ; информационная безопасность ; phishing ; artificial intelligence ; machine learning ; stacking ; ensemble methods ; website classification ; information security |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 10.03.01 |
Speciality group (FGOS) | 100000 - Информационная безопасность |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-865 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\35739 |
Record create date | 7/30/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Целью работы является автоматизация выявления фишинговых веб-сайтов путём построения ансамблевой модели стекинга. Объектом исследования является фишинговые веб-сайты. Задачи, решаемые в ходе исследования: 1.Проанализировать архитектуру и методы функционирования фишинговых веб-сайтов, выявив их характерные признаки. 2.Оценить применимость методов машинного обучения для выявления фишинговых сайтов и определить наиболее эффективные модели. 3.Разработать и экспериментально оценить метод автоматической классификации веб-сайтов на фишинговые и легитимные с использованием ансамблевого подхода на основе стекинга. В ходе работы исследованы архитектура и особенности функционирования фишинговых веб-сайтов, а также современные алгоритмы машинного обучения для их автоматического выявления. Проведён сравнительный анализ эффективности различных моделей. В результате разработана программная система, состоящая из двух модулей: модуль извлечения признаков URL-адреса и модуль классификации с использованием ансамблевой модели стекинга. Эксперименты показали, что стекинг обеспечивает наивысшую точность (97,62%) по сравнению с отдельными моделями. Полученные результаты могут быть использованы для интеграции систем автоматического выявления фишинговых сайтов.
The purpose of the study is the automation of phishing-website detection by constructing an ensemble stacking model. The object of the research is phishing websites. The research set the following goals: 1.Analyze the architecture and operating methods of phishing websites, identifying their characteristic features. 2.Evaluate the applicability of machine-learning methods for detecting phishing sites and determine the most effective models. 3.Develop and experimentally evaluate a method for automatically classifying websites as phishing or legitimate using an ensemble stacking approach. During the work, the architecture and specific behaviour of phishing websites were investigated, and modern machine-learning algorithms for their automatic detection were analysed. A comparative evaluation of different models was carried out. As a result, a software system was developed consisting of two modules: a URL-feature-extraction module and a classification module employing an ensemble stacking model. Experiments showed that the stacking ensemble achieved the highest accuracy (97.62 %) compared with individual models. The obtained results can be applied to the integration of automated phishing-site detection systems.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- РЕФЕРАТ
- ABSTRACT
- Содержание
- Определения, обозначения и сокращения
- Введение
- 1 Архитектура и методы работы фишинговых веб-сайтов
- 1.1 Доменное имя и URL-адрес
- 1.2 HTML-структура
- 1.3 HTTPS-сертификаты
- 1.4 API-запросы
- 1.5 Использование JavaScript
- 1.6 Методы взаимодействия с пользователем
- 1.7 Выводы
- 2 Методы машинного обучения для выявления фишинговых веб-сайтов
- 2.1 Дерево решений
- 2.2 Случайный лес
- 2.3 Метод опорных векторов
- 2.4 Градиентный бустинг (XGBoost, LightGBM, CatBoost)
- 2.5 Логистическая регрессия
- 2.6 Метод K-ближайших соседей
- 2.7 Наивный байес
- 2.8 Метод голосования (Voting)
- 2.9 Стекинг (Stacking)
- 2.10 Глубокое обучение (нейронные сети)
- 2.11 Выводы
- 3 Практическая часть: набор данных и реализация
- 3.1 Результаты обучения моделей
- 3.2 Выводы
- Заключение
- Список использованных источников
- Приложение 1. Модуль онлайн проверки URL
- Приложение 2. Модуль обучения моделей
Access count: 0
Last 30 days: 0