Details

Title: Исследование и разработка алгоритмов расширения данных в контексте обработки изображений методами машинного обучения: выпускная квалификационная работа магистра: направление 09.04.03 «Прикладная информатика» ; образовательная программа 09.04.03_04 «Интеллектуальные технологии управления знаниями и данными»
Creators: Смирных Родион Олегович
Scientific adviser: Туральчук Константин Анатольевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint: Санкт-Петербург, 2024
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: GAN; генеративно-состязательные сети; grad-CAM; сверточные сети; обработка изображений; расширение данных; RandAugment; generative-adversarial networks; grad–CAM; convolutional networks; image processing; data augmentation
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.03
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-2022
Rights: Доступ по паролю из сети Интернет (чтение)
Additionally: New arrival
Record key: ru\spstu\vkr\28998

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Предметом исследования настоящей выпускной квалификационной работы является разработка и применение методов расширения данных с использованием генеративно-состязательных сетей (GAN) и визуализационных методов Grad-CAM в контексте обработки изображений методами машинного обучения. Цель ВКР — разработка генеративно-состязательной сети для расширения обучающих наборов данных, улучшения модели классификации и выявления дефектов в изображениях. Метод проведения ВКР: эксперименты и сравнение результатов. Задачи ВКР включают: разработку и обучение моделей генеративно-состязательных сетей на различных наборах данных; применение методов визуализации Grad-CAM для выявления дефектов в классификационных визуализациях; тестирование моделей ResNet, DenseNet и EfficientNet с использованием расширенных данных. Область применения результатов ВКР: автоматизация процессов расширения данных в задачах машинного обучения; улучшение качества классификационных моделей; применение визуализационных методов для оценки моделей машинного обучения. Выводы: применение GAN и Grad-CAM улучшило эффективность обработки изображений; разработанная методика позволяет улучшить производительность классификаторов и выявлять дефекты в изображениях; модификация моделей генеративно-состязательных сетей с использованием блоков Squeeze-and-Excitation показала эффективность и применимость в реальных задачах машинного обучения. Таким образом, данное исследование подтверждает актуальность использования передовых методов расширения данных и их значимость для улучшения моделей машинного обучения в различных областях.

The subject of this graduate qualification work is the development and application of data augmentation methods using generative adversarial networks (GAN) and Grad-CAM visualization methods in the context of image processing with machine learning methods. The objective of the work is the development of a generative adversarial network for augmenting training datasets, improving classification models, and detecting defects in images. Method of research: experiments and comparison of results. The tasks of the work include: developing and training generative adversarial network models on various datasets; applying Grad-CAM visualization methods to detect defects in classification visualizations; testing ResNet, DenseNet, and EfficientNet models using augmented data. The application area of the work results includes: automation of data augmentation processes in machine learning tasks; improving the quality of classification models; applying visualization methods for evaluating machine learning models. Conclusions: using GAN and Grad-CAM improved the efficiency of image processing; the developed methodology allows improving the performance of classifiers and detecting defects in images; modifying GAN models with Squeeze-and-Excitation blocks has shown effectiveness and applicability in real machine learning tasks. Thus, this study confirms the relevance of advanced data augmentation methods and their significance for improving machine learning models in various fields.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Table of Contents

  • Исследование и разработка алгоритмов расширения данных в контексте обработки изображений методами машинного обучения
    • Введение
    • 1. Обзор алгоритмов и подходов к расширению данных
    • 2. Исследование существующих методов и программных средств по расширению данных в контексте машинного обучения
    • 3. Проектирование и разработка программных модулей для генерации изображений и обнаружения дефектов в сгенерированных данных
    • 4. Тестирование разработанных программных модулей в контексте обработки изображений методами машинного обучения
    • Заключение
    • Список использованных источников
    • Приложение 1. Исходный код скрипта обучения GAN
    • Приложение 2. Исходный код скрипта тестирования
    • Приложение 3. UML диаграмма скрипта обучения GAN
    • Приложение 4. UML диаграмма скрипта тестирования

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics