Информационная модель обработки звуковой информации: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»

Салчак, Станислав Георгиевич

Details

Title	Информационная модель обработки звуковой информации: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Creators	Салчак Станислав Георгиевич
Scientific adviser	Селиверстов Ярослав Александрович
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint	Санкт-Петербург, 2023
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	глубокое обучение аудио ; искусственный интеллект ; классификация данных ; информационная модель ; deep learning audio ; artifical language ; data classification ; information model
Document type	Bachelor graduation qualification work
File type	PDF
Language	Russian
Level of education	Bachelor
Speciality code (FGOS)	09.03.02
Speciality group (FGOS)	090000 - Информатика и вычислительная техника
DOI	10.18720/SPBPU/3/2023/vr/vr23-1315
Rights	Доступ по паролю из сети Интернет (чтение)
Record key	ru\spstu\vkr\21666
Record create date	6/26/2023

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

Объекты исследования: аудиофайлы различных жанров.Предметом исследования являются модели и методы глубокого обучения аудио.Целью данной дипломной работы является исследование методов глубокого обучения аудио, ее программная реализация, тестирование и анализ полученных данных.Работа состоит из введения, четырех глав и заключения.В первой главе приводятся общие понятия, чтобы понять что такое звук, вводится понятие спектрограмма и виды моделей глубокого обучения.Во второй главе приводится полная информационная модель спектрограммы, её преобразование в спектрограмму Мела.В третьей главе приводится оптимизация спектрограмм, путём введения гиперпараметров и коэффицентов.В четвертой главе представлена архитектура приложения глубокого обучения аудио, его реализация и анализ полученных данных. Заключение включает основные выводы по работе.

Research object: audio files of various genres.Research subject: models and methods of deep audio learning.The purpose of this bachelor’s thesis is to research the methods of deep learning audio, its software implementation, testing and analysis of the received data.Thesis consists of an introduction, four sections and conclusion.In the first chapter, general concepts are given to understand what sound is, the concept of a spectrogram and types of deep learning models are introduced.The second chapter provides a complete information model of the spectrogram, its transformation into the Mel spectrogram.The third chapter provides optimization of spectrograms by introducing hyperparameters and coefficients.The fourth chapter introduces the architecture of the audio deep learning application, its implementation, and data analysis. The conclusion includes the main results of the work.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 11
Last 30 days: 0

Detailed usage statistics