Details

Title: Стратегии параллелизации архитектуры параллельного векторного процессора на основе свёрточных нейронных сетей: выпускная квалификационная работа магистра по направлению 09.04.01 - Информатика и вычислительная техника ; 09.04.01_17 - Интеллектуальные системы (международная образовательная программа)
Creators: Муаз Бабар
Scientific adviser: Потехин Вячеслав Витальевич
Other creators: Селиванова Елена Николаевна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2019
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Искусственный интеллект; Вычислительные сети — Архитектура; обнаружение объектов; Advance Driving Assistance Systems; оптимизация памяти
UDC: 004.272.45
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-5775
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\5092

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Обнаружение объектов является основным полевым приложением Advance Driving Assistance Systems (ADAS), которое стало возможным благодаря архитектуре на базе векторных процессоров VPRO для аппаратного ускорителя искусственного интеллекта для конкретного приложения. Очень важно полностью использовать процессор, используя механизмы параллелизма. Сверточные нейронные сети (CNN) являются многообещающим инструментом для интеллектуальной маркировки сцен, но они также очень дороги в вычислительном отношении и требуют большого количества данных для выполнения вычислений. Огромная передача данных создает проблемы с аппаратной пропускной способностью, что очень критично для ограничения скорости и энергопотребления. Это исследование посвящено оптимизации памяти в VPRO, изучаются и сравниваются различные схемы, чтобы эффективно обрабатывать интенсивный трафик данных для маркировки сцен. Предложена подходящая модель CNN, и она также обеспокоена тем, как можно реализовать эти оптимизации памяти.

Object detection is a major field application of Advance Driving Assistance Systems (ADAS) which is made possible on VPRO- a vector processor based architecture for application specific AI-hardware accelerator. It is of great concern to utilize the processor fully by exploiting parallelism mechanisms. Convolutional Neural networks (CNN’s) are promising tool for intelligent scene labelling, but It is also computationally very expensive and requires lot of data transfers in order to perform calculations. Huge data transfers bring hardware bandwidth problem, it is very critical limiting speed and energy requirements. This study is about memory optimization in VPRO, different schemes are studied and compared to efficiently handle intensive data traffic for scene labelling. A suitable CNN model is suggested and it is also taken in concern how these memory optimizations can be implemented.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 39
Last 30 days: 0
Detailed usage statistics