Детальная информация

Название: Исследование ускорения обучения генеративных состязательных сетей: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_02 «Системное программирование»
Авторы: Денисов Павел Павлович
Научный руководитель: Чуканов Вячеслав Сергеевич
Другие авторы: Арефьева Людмила Анатольевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: генеративно-состязательные сети; автокодеры; нейронные сети; ускорение обучения; генерация изображений; generative adversarial networks; autoencoders; neural networks; learning time acceleration; image generation
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 01.03.02
Группа специальностей ФГОС: 010000 - Математика и механика
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1453
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\8288

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Данная работа посвящена исследованию ускорения обучения генеративно-состязательных сетей и разработке новой методики обучения GAN, позволяющей с сохранением качества генерируемых изображений существенно улучшить время обучения. Задачи, которые решались в ходе исследования: 1. Анализ существующих моделей генеративно-состязательных сетей и автокодеров, их архитектур и методик их обучения. 2. Выбор наиболее перспективных моделей сетей, то есть как можно более эффективных по времени обучения. 3. Разработка новой методики обучения GAN. 4. Тестирование разработанной методики обучения генеративно-состязательных сетей. Основная идея метода – использование в качестве «генератора» в генеративно-состязательной сети декодировщика из предобученного автокодера. Тем самым, время на обучение GAN будет складываться из времени, потраченного на предобучение автокодера, и времени, потраченного на обучение «слияния» GAN и декодера. Был проведен анализ существующих различных архитектур генеративно-состязательных сетей и автокодеров, из которых были выбраны архитектуры WGAN-GP для GAN и WAE для автокодера. Была разработана новая методика обучения генеративно-состязательных сетей. В ходе ее тестирования был проведен ряд экспериментов на датасете MNIST, по результатам которых модель, обученная по предложенной методике, не уступала по качеству исходному WGAN-GP, однако время обучения сократилось на 48%.

This paper is devoted to the study of acceleration of training generative adversarial networks and the development of the new method of training GAN, which can significantly improve the learning time while maintaining the quality of the generated samples. The research set the following goals: 1. Analysis of existing models of generative adversarial networks and autoencoders, their architectures and methods of their training. 2. The choice of the most promising network models, that is, the most time-efficient training possible. 3. Development of a new GAN training methodology. 4. Testing the developed training methodology for generative adversarial networks. The main idea of the method is the use of a decoder from pre-trained autoencoder model as a generator in a generative adversarial network. Thus, the time spent on training the GAN will consist of the time spent on pre-training the autoencoder and the time spent on training merged GAN model. Various architectures of generative adversarial networks and autoencoders were examined, from which WGAN-GP architecture for GAN and WAE architecture for autoencoder were selected. A new methodology for training generative adversarial networks has been developed. During its methodology, a series of experiments have been conducted on MNIST dataset, according to the results of which the proposed model was not inferior in quality to the original WGAN-GP model, however, the training time has been reduced by 48%.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 7
За последние 30 дней: 0
Подробная статистика