Детальная информация

Название Информационная модель обработки звуковой информации: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Авторы Салчак Станислав Георгиевич
Научный руководитель Селиверстов Ярослав Александрович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения Санкт-Петербург, 2023
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика глубокое обучение аудио; искусственный интеллект; классификация данных; информационная модель; deep learning audio; artifical language; data classification; information model
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.02
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2023/vr/vr23-1315
Права доступа Доступ по паролю из сети Интернет (чтение)
Ключ записи ru\spstu\vkr\21666
Дата создания записи 26.06.2023

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Объекты исследования: аудиофайлы различных жанров.Предметом исследования являются модели и методы глубокого обучения аудио.Целью данной дипломной работы является исследование методов глубокого обучения аудио, ее программная реализация, тестирование и анализ полученных данных.Работа состоит из введения, четырех глав и заключения.В первой главе приводятся общие понятия, чтобы понять что такое звук, вводится понятие спектрограмма и виды моделей глубокого обучения.Во второй главе приводится полная информационная модель спектрограммы, её преобразование в спектрограмму Мела.В третьей главе  приводится оптимизация спектрограмм, путём введения гиперпараметров и коэффицентов.В четвертой главе представлена архитектура приложения глубокого обучения аудио, его реализация и анализ полученных данных. Заключение включает основные выводы по работе.

Research object: audio files of various genres.Research subject: models and methods of deep audio learning.The purpose of this bachelor’s thesis is to research the methods of deep learning audio, its software implementation, testing and analysis of the received data.Thesis consists of an introduction, four sections and conclusion.In the first chapter, general concepts are given to understand what sound is, the concept of a spectrogram and types of deep learning models are introduced.The second chapter provides a complete information model of the spectrogram, its transformation into the Mel spectrogram.The third chapter provides optimization of spectrograms by introducing hyperparameters and coefficients.The fourth chapter introduces the architecture of the audio deep learning application, its implementation, and data analysis. The conclusion includes the main results of the work.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 6 
За последние 30 дней: 1

Подробная статистика