Детальная информация

Название: Классификация городских звуков с помощью рекуррентных нейронных сетей: выпускная квалификационная работа бакалавра: 09.03.01 - Информатика и вычислительная техника ; 09.03.01_02 - Технологии разработки программного обеспечения
Авторы: Леженин Юрий Игоревич
Научный руководитель: Богач Наталья Владимировна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2019
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: классификация звуков окружающей среды; нейронные сети с долгой краткосрочной памятью; сверточные нейронные сети; environmental sound classification; long short-term memory neural networks; convolutional neural networks
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-913
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\3381

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Классификация звуков окружающей среды получила большое внимание в последние годы. Анализ звуков окружающей среды затруднен из-за их неструктурированной природы. Однако, наличие устойчивых частотно временных паттернов распределения энергии делает классификацию возможной. Поскольку нейронные сети архитектуры LSTM эффективны при обработке временных зависимостей, в данной работе описана и исследована модель на основе LSTM для классификации городских звуков. Модель обучена на амплитудных спектрограммах с нелинейным масштабом частоты в мелах, извлеченных из записей набора данных UrbanSound8K. Предложенная модель оценивается с использованием 5-кратной перекрестной проверки и сравнивается с базовой моделью на основе CNN. В данной работе показано, что модель на основе LSTM превосходит большинство существующих решений и является более точной и надежной, чем базовая модель на основе CNN.

Environmental sound classification has received more attention in recent years. Analysis of environmental sounds is difficult because of its unstructured nature. However, the presence of strong spectro-temporal patterns makes the classification possible. Since LSTM neural networks are efficient at learning temporal dependencies we propose and examine a LSTM model for urban sound classification. The model is trained on magnitude mel-spectrograms extracted from UrbanSound8K dataset audio. The proposed network is evaluated using 5-fold cross-validation and compared with the baseline CNN. It is shown that the LSTM model outperforms a set of existing solutions and is more accurate and confident than the baseline CNN.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 85
За последние 30 дней: 5
Подробная статистика