Детальная информация

Название Распознование эмоций по голосу: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Авторы Шагеева Эрика Валеевна
Научный руководитель Богач Наталья Владимировна
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика CNN ; MFCC ; SER ; нейронная сеть ; глубокое обучение ; спектрограмма ; фрактальные размерности ; распознавание эмоций ; PCA ; F-критерий ; neural network ; deep learning ; spectrogram ; fractal dimensions ; emotion recognition ; F-test
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-3032
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\37290
Дата создания записи 19.09.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Тема выпускной квалификационной работы: «Разработка системы распо знавания эмоций по голосу с использованием фрактальных характеристик». Работа состоит из нескольких этапов: обзор предметной области, описание системы, программная реализация модели и анализ результатов. В данной работе производится изучение сферы речевого распознавания эмоций, анализ и выявле ние основных компонентов, которые необходимы для построения современной системы SER. Были разработаны функции и методы для извлечения речевых признаков, включая MFCC, мел-спектрограммы, частоту пересечения нуля и четыре типа фрактальных размерностей: Каца, Кастильони, Петросяна и Хигучи. Реализована архитектура одномерной сверточной нейронной сети с использованием методов регуляризации и снижения размерности через PCA. В качестве результатов получены шесть обученных моделей на русско язычном датасете DUSHA. Базовая модель показала точность 78,11%, модель с полным набором фрактальных размерностей достигла 82,76%. Статистический анализ подтвердил значимость улучшений (p<0,05), что доказывает эффектив ность использования фрактальных размерностей для классификации эмоций в русской речи.

The subject of the graduate qualification work: "Development of a speech emo tion recognition system using fractal characteristics". The work consists of several stages: literature review, system description, soft ware implementation of the model, and results analysis. This work studies the field of speech emotion recognition, analyzes and identifies the main components necessary for building a modern SER system. Functions and methods for extracting speech features were developed, including MFCC, mel-spectrograms, zero crossing rate, and four types of fractal dimensions: Katz, Castiglioni, Petrosian, and Higuchi. A one-dimensional convolutional neural net work architecture was implemented using regularization methods and dimensionality reduction through PCA. As results, six trained models were obtained on the Russian-language DUSHA dataset. The baseline model showed an accuracy of 78.11%, while the model with the full set of fractal dimensions achieved 82.76%. Statistical analysis confirmed the sig nificance of improvements (p<0.05), proving the effectiveness of using fractal dimen sions for emotion classification in Russian speech.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика