Details

Title: Использование свёрточных искусственных нейронных сетей для сравнения программного обеспечения: выпускная квалификационная работа специалиста: направление 10.05.03 «Информационная безопасность автоматизированных систем» ; образовательная программа 10.05.03_08 «Анализ безопасности информационных систем»
Creators: Попов Борис Евгеньевич
Scientific adviser: Никольский Алексей Валерьевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Нейронные сети; Вычислительные машины электронные персональные — Программы; нечеткое хэширование; векторное расстояние; fuzzy hashing; vector distance
UDC: 004.032.26; 004.422.8
Document type: Specialist graduation qualification work
File type: PDF
Language: Russian
Level of education: Specialist
Speciality code (FGOS): 10.05.03
Speciality group (FGOS): 100000 - Информационная безопасность
DOI: 10.18720/SPBPU/3/2020/vr/vr20-5173
Rights: Доступ по паролю из сети Интернет (чтение)
Additionally: New arrival
Record key: ru\spstu\vkr\27024

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Использование свёрточных искусственных нейронных сетей для сравнения ПО». Данная работа посвящена изучению способов определения сходства файлов на основе алгоритмов машинного обучения. В ходе исследования были решены следующие задачи: - исследование применимости алгоритмов на основе фаззи-хэшей в задаче определения сходства файлов и выявление их недостатков; - подготовка выборки данных для разработки и тестирования средств, использующих алгоритмы нахождения фаззи-хэшей и алгоритмы машинного обучения; - разработка программ для вычисления фаззи-хэшей и оценки их сходства в рамках тестовой выборки; - выбор алгоритмов и разработка программ, использующих алгоритмы машинного обучения для решения задачи определения сходства файлов в рамках тестовой выборки, а также оценка результатов; - разработка средств визуализации аналитических данных, полученных при работе разработанных алгоритмов; - разработка методики сравнения результатов сходства для двух типов алгоритмов – использующих фаззи-хэши и использующих алгоритмы машинного обучения. В первой главе даны описание и сравнительный анализ различных алгоритмов кластеризации, описание методов сокращения размерности, а также описаны алгоритмы на основе сверточных нейронных сетей и нечетких хэшей, примененные в программной реализации. Во второй главе приводится описание исследования, в ходе которого произведено практическое сравнение применимости различных методов выявления схожести объектов. Так же дано описание применявшихся методик визуализации получаемых результатов. В третьей главе приводится описание собственного метода сравнения программного обеспечения и результаты его тестирования.

Work theme: "The use of convolutional artificial neural networks for comparing software". This work is devoted to the study of methods for determining the similarity of files based on machine learning algorithms. Solved tasks: - study of the applicability of algorithms based on fuzzy hashes in the task of determining the similarity of files; - preparation of a data for the development and testing of tools based on fuzzy hash algorithms and machine learning algorithms; - development of programs for calculating fuzzy hashes and assessing their similarity within the test sample; - selection of algorithms and development of programs that use machine learning algorithms to solve the problem of determining the similarity of files within a test sample, as well as evaluating the results; - development of visualization tools for analytical data obtained during the work; - development of a methodology for comparing similarity results for two types of algorithms – based on fuzzy hashes and based on machine learning algorithms. The first chapter gives a description and comparative analysis of various clustering algorithms, a description of dimensional reduction methods, and so algorithms based on convolutional neural networks and fuzzy are described hashes applied in software implementation. The second chapter describes the study during which practical comparison of the applicability of various methods identify the similarity of objects. A description is also given of the applied visualization techniques for the results. The third chapter describes your own comparison method. software and its testing results.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics