Детальная информация

Название Мультимодальное распознавание эмоций: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_01 «Разработка компьютерных систем»
Авторы Непомнящий Матвей Тимофеевич
Научный руководитель Куляшова Зинаида Викторовна
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика мультимодальное распознавание эмоций ; нейросетевые модели ; компьютерное зрение ; распознавание речи ; обработка естественного языка ; машинное обучение ; глубокое обучение ; классификация эмоций ; видеоаналитика ; аудиоаналитика ; модульная архитектура ; интеллектуальные системы ; временные последовательности ; интеграция модальностей ; multimodal emotion recognition ; neural network models ; computer vision ; speech recognition ; natural language processing ; machine learning ; deep learning ; emotion classification ; video analytics ; audio analytics ; modular architecture ; intelligent systems ; temporal sequences ; modality integration
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-2518
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\37101
Дата создания записи 19.09.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Работа посвящена разработке системы мультимодального распознавания эмоций на основе видео- и аудиопотоков. В основе лежит модульная архитектура с независимой обработкой визуальной, аудио- и текстовой информации и последующим объединением результатов. Для каждой модальности применяются специализированные нейросетевые модели: ResNet для лица, wav2vec 2.0 и спектрограммы для звука, RoBERTa — для текста.

The presented work is devoted to the development of a system for multimodal emotion recognition based on the analysis of video and audio streams. The system is built using a modular architecture, where each modality is processed independently using specialized models: ResNet for facial expression analysis, wav2vec 2.0 and spectrogram-based CNNs for acoustic analysis, and the RoBERTa transformer model for text-based emotion recognition.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика