Детальная информация

Название: Разработка и исследование модификаций моделей классификации "от грубого к точному" в задачах: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Авторы: Чжан Юйи
Научный руководитель: Уткин Лев Владимирович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2022
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Изображения; Нейронные сети; разделение весов; классификация изображений; weight sharing; image classification
УДК: 621.397; 004.032.26
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 02.04.01
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2022/vr/vr22-4009
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\18232

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Задача классификации изображений всегда была актуальной темой в области компьютерного зрения. В условиях огромного объема данных изображений традиционный метод обработки признаков оказался неэффективным. С улучшением вычислительной производительности компьютера, существующие конволюционные нейронные сети решили большинство проблем классификации изображений, но проблемы построения сети, низкой точности классификации и большого расхода вычислений требуют решения. В связи с вышеуказанными проблемами, с точки зрения объединения признаков и разделения веса, предлагаются две улучшенные модели сверточных нейронных сетей: Во-первых, существующие сверточные сети полагаются только на обучающие признаки для предсказания категории изображения. Этот метод игнорирует влияние искусственных особенностей дизайна. Предлагается алгоритм классификации изображений на основе салиентных признаков и глубокого обучения. Сначала объединяются салиентный признак и признак BGR исходного изображения. Затем сверточная сеть выполняет автоматическое обучение признаков на слитом многофункциональном изображении для извлечения нескольких признаков изображения. Наконец, изображение классифицируется классификатором Softmax. Эксперимент показал, что алгоритм является новым алгоритмом классификации изображений с высокой устойчивостью и хорошим эффектом классификации. Во-вторых, большинство существующих сверточных сетей используют огромное количество параметров, обусловленных глубиной сети, и не обладают устойчивостью к масштабным особенностям входного изображения. Учитывая эти проблемы, предлагается параллельная сверточная нейронная сеть с разделением веса (WPCNN). Сначала изображение на обучающем множестве и изображение после масштабирования вводятся в параллельную сеть с разделением весов для извлечения разномасштабных входных признаков. Затем в иерархической сети используются многослойные свертки для извлечения одинаковых входных признаков изображения. Далее используется идея слияния признаков для объединения двух признаков с целью повышения устойчивости сети к многомасштабным признакам. Наконец, параметры сети оптимизируются для достижения эффективного извлечения признаков. Результаты экспериментов на наборах данных cifar, fer2013 и других показывают, что предложенная модель достигает высокой точности классификации. Результаты доказывают, что сверточная нейронная сеть с объединением признаков и распределением веса является одним из эффективных методов решения проблемы точности классификации многомасштабных изображений.

Image classification task has always been the hot topic in the field of computer vision. In the face of massive image data, the traditional feature processing method has been stretched out. With the improvement of computing performance for computer, the existing convolutional neural networks solved most of the image classification problems, but the problems of network construction, low classification accuracy, and large calculation consumption need to be solved. In view of the above problems, from the perspective of feature fusion and weight sharing, two improved convolution neural network models are proposed, as follows: First, the existing convolution networks only relies on the learning features to predict the category of the image. This mothod ignores the influence of the artificial design features. An image classification algorithm based on salient features and deep learning is proposed. Firstly, the salient feature and the BGR feature of the original image are fused. Then, the convolution network performs automatic feature learning on the fused multi feature image to extract the multiple features of the image. Finally, the image is classified by softmax classifier. The experiment shows that the algorithm is a new image classification algorithm with strong robustness and good classification effect. Secondly, Most of the existing convolution networks make use of the huge amount of parameters caused by the network depth and lack robustness to scale features of input image. In view of the problems, a weight-shared parallel convolutional neural network (WPCNN) is proposed. Firstly, the image on the training set and the image after zooming are input into the weight-shared parallel network to extract multi-scale input features. Then, in the hierarchical network, multi-layer convolutions are used to extract the same input image features. Next, the idea of feature fusion are used to fuse two features to enhance the robustness of the network for multi-scale features. Finally, the network parameters are optimized to achieve efficient feature extraction. The experimental results on cifar, fer2013 and other datasets show that the proposed model achieves high classification accuracy. And the results prove that the convolution neural network with feature fusion and weight sharing is one of the effective methods to solve the problem of multi-scale image classification accuracy.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Внешние организации №2 Все Прочитать
Внешние организации №1 Все
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
Интернет Авторизованные пользователи (не СПбПУ, №2) Прочитать
Интернет Авторизованные пользователи (не СПбПУ, №1)
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 2
За последние 30 дней: 1
Подробная статистика