Details

Нижникова, Виктория Сергеевна. Разработка системы обнаружения и распознавания объектов на изображениях на основе искусственных нейронных сетей в системах технического зрения [Электронный ресурс]: бакалаврская работа: 15.03.06 / В. С. Нижникова; Санкт-Петербургский политехнический университет Петра Великого, Институт металлургии, машиностроения и транспорта; науч. рук. А. В. Бахшиев. — Электрон. текстовые дан. (1 файл : 2,40 МБ). — Санкт-Петербург, 2017. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v17-4872.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v17-4872>.

Record create date: 10/25/2017

Subject: Нейронные сети; Распознавание образов; Телевизионные камеры; Изображения; Робототехнические системы

Collections: Выпускные квалификационные работы; Общая коллекция

Links: DOI

Allowed Actions: Read You need Flash Player to read document

Group: Anonymous

Network: Internet

Annotation

В данной работе описана разработка системы определения пространственного положения ключевых точек скелета человека по одиночному изображению с телевизионной камеры. Система основана на нейронных сетях VGG-16 и ResNet-101, для которых подобраны оптимальные гиперпараметры и проведено обучение.

Document access rights

Network User group Action
FL SPbPU Local Network All Read Print
-> Internet All Read Print

Table of Contents

  • Введение
  • 1 Обзор архитектур сверточных нейронных сетей и библиотек прототипирования
    • 1.1 Нейронные сети
    • 1.2 Первая сверточная нейронная сеть LeNet
    • 1.3 Вычисление на графическом ускорителе, архитектура AlexNet
    • 1.4 Методы предотвращения переобучения
    • 1.5 Архитектуры VGG-16, VGG-19
    • 1.6 Сеть внутри сети (Сascaded Сross Сhannel Parameteric pooling)
    • 1.7 Полностью сверточная сеть (fully convolutional network)
    • 1.8 Архитектура Google Inception
    • 1.9 Архитектура ResNet
    • 1.10 Обзор основных пакетов для работы с нейронными сетями
      • 1.10.1 Theano
      • 1.10.2 Torch
      • 1.10.3 TensorFlow
      • 1.10.4 Caffe
      • 1.10.5 Сравнение библиотек глубокого обучения
    • 1.11 Формулировка целей работы
    • 1.12 Выводы по разделу
  • 2 Математическое описание
    • 2.1 Основные слои сверточных нейронных сетей
    • 2.2 Алгоритмы оптимизации функции ошибки
      • 2.2.1 Общий вид алгоритма оптимизации функции ошибки
      • 2.2.2 Стохастический градиентный спуск
      • 2.2.3 Ускоренный градиентный спуск Нестерова (NAG)
      • 2.2.4 Адаптивный градиентный спуск Adagrad
      • 2.2.5 Pобастный метод подбора скорости обучения - Adadelta
      • 2.2.6 Метод оптимизации RMSprop
      • 2.2.7 Метод оптимизации Adam
    • 2.3 Структура сети VGG-16, размерности слоев
    • 2.4 Структура сети ResNet-101, размерности слоев
    • 2.5 Выводы по разделу
  • 3 Разработка системы обнаружения и распознавания объектов на изображениях на основе искусственных нейронных сетей
    • 3.1 Разработка системы обнаружения и распознавания
    • 3.2 Структура разработанных программных модулей для обучения нейронных сетей
    • 3.3 Модуль подготовки данных
    • 3.4 Модуль подбора гиперпараметров
    • 3.5 Система обнаружения и распознавания и модуль тестирования
  • 4 Разработка системы решения задачи регрессии и экспериментальные исследования
    • 4.1 Подготовка данных для обучения нейронной сети
      • 4.1.1 Описание исходных данных
    • 4.2 Создание сети на основе VGG-16 и обучение с экспериментально подобранными параметрами
    • 4.3 Базовый подбор гиперпараметров для VGG-16. Обучение с оптимальными параметрами
    • 4.4 Базовый подбор гиперпараметров для ResNet-101. Обучение с оптимальными параметрами
    • 4.5 Сравнение значений ошибки для обученных нейронных сетей
    • 4.6 Визуальное тестирование обученных нейронных сетей
    • 4.7 Выводы по разделу
  • Заключение
  • Список используемой литературы

Document usage statistics

stat Document access count: 166
Last 30 days: 4
Detailed usage statistics