Детальная информация

Название Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи»
Авторы Андреев Иван Дмитриевич
Научный руководитель Попов Евгений Александрович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика синтез речи ; рекуррентная нейройная сеть ; долгая краткосрочная  память  рекуррентной  нейройной  сети ; двунаправленная ; метрика ; мел-спектограмма ; speech synthesis ; recurrent  neural  network ; long  short-term ; memory  of a  recurrent  neural  network ; bidirectional  recurrent  neural  network ; metric ; mel-spectrogram
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 11.03.02
Группа специальностей ФГОС 110000 - Электроника, радиотехника и системы связи
DOI 10.18720/SPBPU/3/2025/vr/vr25-1410
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\36410
Дата создания записи 08.08.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Цель работы – разработка синтезатора речи на основе параметрического метода. В результате исследования были рассмотрены существующие методы генерирования  речи,  была  реализована  система  синтеза  речи  на  основе параметрического метода, затем протестирована. Также были получены мел- спектрограммы,  сходимости  между  кодировщиком  и  декодером  и аудиофайлы.  С  помощью  полученной  информацией  происходил  анализ моделей  с  разным  объёмом речевых  данных.  Затем  модель  с  лучшими характеристиками была сравнена с другими методами синтеза речи. Результатом  работы  являются  генерируемые  аудиофайлы  и  выбор наиболее перспективного метода синтеза речи. Реализованная модель может быть использована для помощи людям с нарушениями  зрения,  озвучивания  маршрутов,  оснащения  транспортов системами речевого ответа.

The  aim  of  the  thesis  is  to develop  a  speech synthesizer  based on  the parametric method. As a result of the research, existing speech generation methods were reviewed,  a speech synthesis system based on the parametric method was implemented, and then tested. Mel-spectrograms, convergence between the encoder and decoder, and audio files were also obtained. The information obtained was used to analyze models with different amounts of speech data. Then, the model with the best charac teristics  was compared with other speech synthesis methods. The results of the work are the generated audio files and the selection of the most promising speech synthesis method. The implemented model can be used to help people with visual impairments,  provide voice guidance for routes, and equip transport with speech response systems.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика