Таблица | Карточка | RUSMARC | |
Разрешенные действия: –
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
Определение эмоций по голосу является одним из ключевых направлений исследований в области распознавания эмоций, а также является сложной задачей в области обработки речи. Речь несет в себе множество информации, которая может быть использована для анализа эмоционального состояния говорящего. В работе представлена модель, которая передает обработанные аудиофайлы в сверточную нейронную сеть (CNN). При обучении модели используется набор данных Dusha. Для выполнения задачи определения эмоций речь, представленная в виде аудиозаписи, проходит несколько этапов обработки. Сначала из аудиозаписи выделяются необходимые признаки, которые затем используются для обучения модели сверточной нейронной сети. После обученная модель используется для классификации эмоций в новых аудиозаписях. Для оценки эффективности разработанной модели был проведён анализ точности классификации. Оценка эффективности модели показала довольно хороший результат среднего гармонического значения точности и полноты - 84,94%.
Speech emotion recognition is one of the key areas of research in the field of emotion recognition, and is also a challenging task in the field of speech processing. Speech carries a lot of information that can be used to analyze the emotional state of the speaker. The paper presents a model that transmits processed audio files to a convolutional neural network (CNN). When training a model using the Dusha dataset. To perform the task of determining emotions, speech presented in the form of an audio recording goes through several stages of processing. First, the necessary features are extracted from the audio recording, which are then used to train a convolutional neural network model. After that, the trained model is used to classify emotions in new audio recordings. To assess the effectiveness of the developed model, an analysis of the classification accuracy was carried out. The evaluation of the effectiveness of the model showed a fairly good result of the average harmonic value of accuracy and completeness – 84,94%.
Права на использование объекта хранения
Место доступа | Группа пользователей | Действие | ||||
---|---|---|---|---|---|---|
Локальная сеть ИБК СПбПУ | Все |
![]() ![]() ![]() |
||||
Интернет | Авторизованные пользователи СПбПУ |
![]() ![]() ![]() |
||||
![]() |
Интернет | Анонимные пользователи |
Статистика использования
|
Количество обращений: 0
За последние 30 дней: 0 Подробная статистика |