Details

Title: Распознавание городских звуков с помощью нейронных сетей: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Creators: Реймер Ирина Дмитриевна
Scientific adviser: Богач Наталья Владимировна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: классификация звуков окружающей среды; нейронные сети; трансформер; environmental sound classification; neural networks; transformer
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3452
Rights: Доступ по паролю из сети Интернет (чтение, печать)
Record key: ru\spstu\vkr\22835

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Данная работа посвящена исследованию задачи классификации городских звуков. Задачи, которые решались в ходе исследования: 1. Исследование применения нейронных сетей в классификации городских звуков и сравнение результатов классификации. 2. Изучение инструментов и наборов данных применимых для классификации городских звуков. 3. Изучение программной реализации лидирующей нейронной сети в классификации городских звуков. 4. Исследование работы лидирующей нейронной сети на других наборах данных. Исследовано применение нейронных сетей в классификации городских звуков. Проведён сравнительный анализ нейронных сетей, в результате чего выявлена лидирующая сеть для классификации городских звуков. Изучены инструменты и наборы данных, используемые для классификации городских звуков. Изучена структура лидирующей нейронной сети, произведена настройка сети для воспроизведения результатов работы на наборе данных ESC-50. Исследована работа ведущей нейронной сети на наборе данных UrbanSound8K.

The given work is devoted to the research of urban sound classification task. The research set the following goals: 1. Research on the application of neural networks in urban sound classification and comparison of classification results. 2. Study of tools and datasets applicable for urban sound classification. 3. Study of the software implementation of the leading neural network in urban sound classification. 4. Exploration of the performance of the leading neural network on other datasets. The application of neural networks in the classification of urban sounds has been investigated. A comparative analysis of neural networks was conducted, leading to the identification of a leading network for urban sound classification. Tools and datasets used for urban sound classification were examined. The structure of the leading neural network was studied, and adjustments were made to replicate the results on the ESC-50 dataset. The performance of the dominant neural network was investigated on the UrbanSound8K dataset.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
Internet Authorized users SPbPU Read Print
-> Internet Anonymous

Table of Contents

  • 1. Применение нейронных сетей в классификации городских звуков
    • 1.1. Типы нейронных сетей
    • 1.2. Классификация городских звуков с использованием трансформеров
  • 2. Инструменты и наборы данных применимых для классификации городских звуков
    • 2.1. Наборы данных
    • 2.2. Инструменты
    • 2.3. Рабочее окружение
  • 3. ИЕРАРХИЧЕСКИЙ ЗВУКОВОЙ ТРАНСФОРМЕР С ТОКЕН-СЕМАНТИЧЕСКИМ МОДУЛЕМ
    • 3.1. Устройство сети
    • 3.2. Настройка сети
    • 3.3. Воспроизведение результатов работы
  • 4. ИССЛЕДОВАНИЕ РАБОТЫ HTS-AT НА НАБОРЕ ДАННЫХ URBANSOUND8K
    • 4.1. Структура набора данных UrbanSound8K
    • 4.2. Результаты классификации набора данных UrbanSound8K в исследованиях
    • 4.3. Результат работы HTS-AT
  • ПРИЛОЖЕНИЕ. ЛИСТИНГИ КОДА

Usage statistics

stat Access count: 20
Last 30 days: 4
Detailed usage statistics