Details
Title | Информационная модель обработки звуковой информации: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» |
---|---|
Creators | Салчак Станислав Георгиевич |
Scientific adviser | Селиверстов Ярослав Александрович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2023 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | глубокое обучение аудио; искусственный интеллект; классификация данных; информационная модель; deep learning audio; artifical language; data classification; information model |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 09.03.02 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-1315 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Record key | ru\spstu\vkr\21666 |
Record create date | 6/26/2023 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Объекты исследования: аудиофайлы различных жанров.Предметом исследования являются модели и методы глубокого обучения аудио.Целью данной дипломной работы является исследование методов глубокого обучения аудио, ее программная реализация, тестирование и анализ полученных данных.Работа состоит из введения, четырех глав и заключения.В первой главе приводятся общие понятия, чтобы понять что такое звук, вводится понятие спектрограмма и виды моделей глубокого обучения.Во второй главе приводится полная информационная модель спектрограммы, её преобразование в спектрограмму Мела.В третьей главе приводится оптимизация спектрограмм, путём введения гиперпараметров и коэффицентов.В четвертой главе представлена архитектура приложения глубокого обучения аудио, его реализация и анализ полученных данных. Заключение включает основные выводы по работе.
Research object: audio files of various genres.Research subject: models and methods of deep audio learning.The purpose of this bachelor’s thesis is to research the methods of deep learning audio, its software implementation, testing and analysis of the received data.Thesis consists of an introduction, four sections and conclusion.In the first chapter, general concepts are given to understand what sound is, the concept of a spectrogram and types of deep learning models are introduced.The second chapter provides a complete information model of the spectrogram, its transformation into the Mel spectrogram.The third chapter provides optimization of spectrograms by introducing hyperparameters and coefficients.The fourth chapter introduces the architecture of the audio deep learning application, its implementation, and data analysis. The conclusion includes the main results of the work.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 11
Last 30 days: 0