Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Тема выпускной квалификационной работы: «Использование свёрточных искусственных нейронных сетей для сравнения ПО». Данная работа посвящена изучению способов определения сходства файлов на основе алгоритмов машинного обучения. В ходе исследования были решены следующие задачи: - исследование применимости алгоритмов на основе фаззи-хэшей в задаче определения сходства файлов и выявление их недостатков; - подготовка выборки данных для разработки и тестирования средств, использующих алгоритмы нахождения фаззи-хэшей и алгоритмы машинного обучения; - разработка программ для вычисления фаззи-хэшей и оценки их сходства в рамках тестовой выборки; - выбор алгоритмов и разработка программ, использующих алгоритмы машинного обучения для решения задачи определения сходства файлов в рамках тестовой выборки, а также оценка результатов; - разработка средств визуализации аналитических данных, полученных при работе разработанных алгоритмов; - разработка методики сравнения результатов сходства для двух типов алгоритмов – использующих фаззи-хэши и использующих алгоритмы машинного обучения. В первой главе даны описание и сравнительный анализ различных алгоритмов кластеризации, описание методов сокращения размерности, а также описаны алгоритмы на основе сверточных нейронных сетей и нечетких хэшей, примененные в программной реализации. Во второй главе приводится описание исследования, в ходе которого произведено практическое сравнение применимости различных методов выявления схожести объектов. Так же дано описание применявшихся методик визуализации получаемых результатов. В третьей главе приводится описание собственного метода сравнения программного обеспечения и результаты его тестирования.
Work theme: "The use of convolutional artificial neural networks for comparing software". This work is devoted to the study of methods for determining the similarity of files based on machine learning algorithms. Solved tasks: - study of the applicability of algorithms based on fuzzy hashes in the task of determining the similarity of files; - preparation of a data for the development and testing of tools based on fuzzy hash algorithms and machine learning algorithms; - development of programs for calculating fuzzy hashes and assessing their similarity within the test sample; - selection of algorithms and development of programs that use machine learning algorithms to solve the problem of determining the similarity of files within a test sample, as well as evaluating the results; - development of visualization tools for analytical data obtained during the work; - development of a methodology for comparing similarity results for two types of algorithms – based on fuzzy hashes and based on machine learning algorithms. The first chapter gives a description and comparative analysis of various clustering algorithms, a description of dimensional reduction methods, and so algorithms based on convolutional neural networks and fuzzy are described hashes applied in software implementation. The second chapter describes the study during which practical comparison of the applicability of various methods identify the similarity of objects. A description is also given of the applied visualization techniques for the results. The third chapter describes your own comparison method. software and its testing results.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Authorized users SPbPU | |||||
Internet | Anonymous |
Usage statistics
Access count: 0
Last 30 days: 0 Detailed usage statistics |