Details

Title: Информационная модель обработки звуковой информации: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Creators: Салчак Станислав Георгиевич
Scientific adviser: Селиверстов Ярослав Александрович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: глубокое обучение аудио; искусственный интеллект; классификация данных; информационная модель; deep learning audio; artifical language; data classification; information model
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.02
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-1315
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\21666

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Объекты исследования: аудиофайлы различных жанров.Предметом исследования являются модели и методы глубокого обучения аудио.Целью данной дипломной работы является исследование методов глубокого обучения аудио, ее программная реализация, тестирование и анализ полученных данных.Работа состоит из введения, четырех глав и заключения.В первой главе приводятся общие понятия, чтобы понять что такое звук, вводится понятие спектрограмма и виды моделей глубокого обучения.Во второй главе приводится полная информационная модель спектрограммы, её преобразование в спектрограмму Мела.В третьей главе  приводится оптимизация спектрограмм, путём введения гиперпараметров и коэффицентов.В четвертой главе представлена архитектура приложения глубокого обучения аудио, его реализация и анализ полученных данных. Заключение включает основные выводы по работе.

Research object: audio files of various genres.Research subject: models and methods of deep audio learning.The purpose of this bachelor’s thesis is to research the methods of deep learning audio, its software implementation, testing and analysis of the received data.Thesis consists of an introduction, four sections and conclusion.In the first chapter, general concepts are given to understand what sound is, the concept of a spectrogram and types of deep learning models are introduced.The second chapter provides a complete information model of the spectrogram, its transformation into the Mel spectrogram.The third chapter provides optimization of spectrograms by introducing hyperparameters and coefficients.The fourth chapter introduces the architecture of the audio deep learning application, its implementation, and data analysis. The conclusion includes the main results of the work.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Usage statistics

stat Access count: 4
Last 30 days: 0
Detailed usage statistics