Details

Title Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи»
Creators Андреев Иван Дмитриевич
Scientific adviser Попов Евгений Александрович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects синтез речи ; рекуррентная нейройная сеть ; долгая краткосрочная  память  рекуррентной  нейройной  сети ; двунаправленная ; метрика ; мел-спектограмма ; speech synthesis ; recurrent  neural  network ; long  short-term ; memory  of a  recurrent  neural  network ; bidirectional  recurrent  neural  network ; metric ; mel-spectrogram
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 11.03.02
Speciality group (FGOS) 110000 - Электроника, радиотехника и системы связи
DOI 10.18720/SPBPU/3/2025/vr/vr25-1410
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\36410
Record create date 8/8/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Цель работы – разработка синтезатора речи на основе параметрического метода. В результате исследования были рассмотрены существующие методы генерирования  речи,  была  реализована  система  синтеза  речи  на  основе параметрического метода, затем протестирована. Также были получены мел- спектрограммы,  сходимости  между  кодировщиком  и  декодером  и аудиофайлы.  С  помощью  полученной  информацией  происходил  анализ моделей  с  разным  объёмом речевых  данных.  Затем  модель  с  лучшими характеристиками была сравнена с другими методами синтеза речи. Результатом  работы  являются  генерируемые  аудиофайлы  и  выбор наиболее перспективного метода синтеза речи. Реализованная модель может быть использована для помощи людям с нарушениями  зрения,  озвучивания  маршрутов,  оснащения  транспортов системами речевого ответа.

The  aim  of  the  thesis  is  to develop  a  speech synthesizer  based on  the parametric method. As a result of the research, existing speech generation methods were reviewed,  a speech synthesis system based on the parametric method was implemented, and then tested. Mel-spectrograms, convergence between the encoder and decoder, and audio files were also obtained. The information obtained was used to analyze models with different amounts of speech data. Then, the model with the best charac teristics  was compared with other speech synthesis methods. The results of the work are the generated audio files and the selection of the most promising speech synthesis method. The implemented model can be used to help people with visual impairments,  provide voice guidance for routes, and equip transport with speech response systems.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics