Детальная информация

Название Machine Learning-Based Approaches for Malware Detection in PE Files: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_17 «Интеллектуальные системы (международная образовательная программа) / Intelligent Systems (International Educational Program)»
Авторы Ларёв Михаил Михайлович
Научный руководитель Сальников Вячеслав Юрьевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика machine learning; malware; detection; windows; rust; python
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 09.04.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-5645
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\33756
Дата создания записи 02.09.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Вредоносное ПО представляет значительную угрозу безопасности и стабильности вычислительных систем. Традиционные методы обнаружения на основе сигнатур и поведения часто не поспевают за быстро меняющимся ландшафтом вредоносного ПО. В этой исследовательской работе «Подходы на основе машинного обучения для обнаружения вредоносного ПО в PE-файлах» изучается применение методов машинного обучения для улучшения обнаружения вредоносного ПО. Сначала в диссертации дается обзор распространенных методов обнаружения вредоносного ПО, включая обнаружение на основе сигнатур, обнаружение на основе поведения, анализ в песочнице и эвристический анализ. В ней также рассматривается современное антивирусное программное обеспечение и роль машинного обучения в обнаружении вредоносного ПО. В разделах теоретической структуры и методологии представлены формат файла PE, используемые наборы данных (образцы DikeDataset и VirusShare.com) и различные оцененные модели машинного обучения, такие как AdaBoost, LightGBM, Random Forest, CatBoost Экспериментальная установка включает предварительную обработку данных, разведочный анализ данных, инициализацию модели и оптимизацию параметров, пакетное обучение модели и интерпретацию прогнозов модели с использованием библиотеки LIME. Обсуждение результатов охватывает метрики оценки (точность, точность, отзыв и оценка F1) и сравнение производительности реализованных моделей машинного обучения. Результаты этой диссертации демонстрируют потенциал подходов на основе машинного обучения в улучшении обнаружения вредоносных программ в PE-файлах. Результаты показывают, что ансамблевые методы, такие как LightGBM и XGBoost, превосходят другие модели с точки зрения точности обнаружения и общей производительности. В диссертации также исследуются потенциальные улучшения и будущие направления исследований в этой области.

Malware poses a significant threat to the security and stability of computing systems. Traditional signature-based and behavior-based detection methods often struggle to keep up with the rapidly evolving landscape of malware. This research work “Machine Learning-Based Approaches for Malware Detection in PE Files” explores the application of machine learning techniques to enhance malware detection. The thesis first provides an overview of common malware detection methods, including signature-based detection, behavior-based detection, sandbox analysis, and heuristic analysis. It also examines contemporary antimalware software and the role of machine learning in malware detection. The theoretical framework and methodology sections introduce the PE file format, datasets used (DikeDataset and VirusShare.com samples), and various machine learning models evaluated, such as AdaBoost, LightGBM, Random Forest, CatBoost The experimental setup involves data preprocessing, exploratory data analysis, model initialization and parameter optimization, batch model training, and interpretation of the model predictions using the LIME library. The results discussion covers the evaluation metrics (accuracy, precision, recall, and F1 score) and a comparison of the performance of the implemented machine learning models. The findings of this thesis demonstrate the potential of machine learning-based approaches in enhancing malware detection in PE files. The results indicate that ensemble methods, such as LightGBM and XGBoost, outperform other models in terms of detection accuracy and overall performance. The thesis also explores potential improvements and future research directions in this domain.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика