Details

Title: Разработка и исследование модификаций моделей классификации "от грубого к точному" в задачах: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Creators: Чжан Юйи
Scientific adviser: Уткин Лев Владимирович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2022
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Изображения; Нейронные сети; разделение весов; классификация изображений; weight sharing; image classification
UDC: 621.397; 004.032.26
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 02.04.01
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2022/vr/vr22-4009
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\18232

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Задача классификации изображений всегда была актуальной темой в области компьютерного зрения. В условиях огромного объема данных изображений традиционный метод обработки признаков оказался неэффективным. С улучшением вычислительной производительности компьютера, существующие конволюционные нейронные сети решили большинство проблем классификации изображений, но проблемы построения сети, низкой точности классификации и большого расхода вычислений требуют решения. В связи с вышеуказанными проблемами, с точки зрения объединения признаков и разделения веса, предлагаются две улучшенные модели сверточных нейронных сетей: Во-первых, существующие сверточные сети полагаются только на обучающие признаки для предсказания категории изображения. Этот метод игнорирует влияние искусственных особенностей дизайна. Предлагается алгоритм классификации изображений на основе салиентных признаков и глубокого обучения. Сначала объединяются салиентный признак и признак BGR исходного изображения. Затем сверточная сеть выполняет автоматическое обучение признаков на слитом многофункциональном изображении для извлечения нескольких признаков изображения. Наконец, изображение классифицируется классификатором Softmax. Эксперимент показал, что алгоритм является новым алгоритмом классификации изображений с высокой устойчивостью и хорошим эффектом классификации. Во-вторых, большинство существующих сверточных сетей используют огромное количество параметров, обусловленных глубиной сети, и не обладают устойчивостью к масштабным особенностям входного изображения. Учитывая эти проблемы, предлагается параллельная сверточная нейронная сеть с разделением веса (WPCNN). Сначала изображение на обучающем множестве и изображение после масштабирования вводятся в параллельную сеть с разделением весов для извлечения разномасштабных входных признаков. Затем в иерархической сети используются многослойные свертки для извлечения одинаковых входных признаков изображения. Далее используется идея слияния признаков для объединения двух признаков с целью повышения устойчивости сети к многомасштабным признакам. Наконец, параметры сети оптимизируются для достижения эффективного извлечения признаков. Результаты экспериментов на наборах данных cifar, fer2013 и других показывают, что предложенная модель достигает высокой точности классификации. Результаты доказывают, что сверточная нейронная сеть с объединением признаков и распределением веса является одним из эффективных методов решения проблемы точности классификации многомасштабных изображений.

Image classification task has always been the hot topic in the field of computer vision. In the face of massive image data, the traditional feature processing method has been stretched out. With the improvement of computing performance for computer, the existing convolutional neural networks solved most of the image classification problems, but the problems of network construction, low classification accuracy, and large calculation consumption need to be solved. In view of the above problems, from the perspective of feature fusion and weight sharing, two improved convolution neural network models are proposed, as follows: First, the existing convolution networks only relies on the learning features to predict the category of the image. This mothod ignores the influence of the artificial design features. An image classification algorithm based on salient features and deep learning is proposed. Firstly, the salient feature and the BGR feature of the original image are fused. Then, the convolution network performs automatic feature learning on the fused multi feature image to extract the multiple features of the image. Finally, the image is classified by softmax classifier. The experiment shows that the algorithm is a new image classification algorithm with strong robustness and good classification effect. Secondly, Most of the existing convolution networks make use of the huge amount of parameters caused by the network depth and lack robustness to scale features of input image. In view of the problems, a weight-shared parallel convolutional neural network (WPCNN) is proposed. Firstly, the image on the training set and the image after zooming are input into the weight-shared parallel network to extract multi-scale input features. Then, in the hierarchical network, multi-layer convolutions are used to extract the same input image features. Next, the idea of feature fusion are used to fuse two features to enhance the robustness of the network for multi-scale features. Finally, the network parameters are optimized to achieve efficient feature extraction. The experimental results on cifar, fer2013 and other datasets show that the proposed model achieves high classification accuracy. And the results prove that the convolution neural network with feature fusion and weight sharing is one of the effective methods to solve the problem of multi-scale image classification accuracy.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 9
Last 30 days: 0
Detailed usage statistics