Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи»

Андреев, Иван Дмитриевич

Details

Title	Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи»
Creators	Андреев Иван Дмитриевич
Scientific adviser	Попов Евгений Александрович
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций
Imprint	Санкт-Петербург, 2025
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	синтез речи ; рекуррентная нейройная сеть ; долгая краткосрочная память рекуррентной нейройной сети ; двунаправленная ; метрика ; мел-спектограмма ; speech synthesis ; recurrent neural network ; long short-term ; memory of a recurrent neural network ; bidirectional recurrent neural network ; metric ; mel-spectrogram
Document type	Bachelor graduation qualification work
File type	PDF
Language	Russian
Level of education	Bachelor
Speciality code (FGOS)	11.03.02
Speciality group (FGOS)	110000 - Электроника, радиотехника и системы связи
DOI	10.18720/SPBPU/3/2025/vr/vr25-1410
Rights	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally	New arrival
Record key	ru\spstu\vkr\36410
Record create date	8/8/2025

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

Цель работы – разработка синтезатора речи на основе параметрического метода. В результате исследования были рассмотрены существующие методы генерирования речи, была реализована система синтеза речи на основе параметрического метода, затем протестирована. Также были получены мел- спектрограммы, сходимости между кодировщиком и декодером и аудиофайлы. С помощью полученной информацией происходил анализ моделей с разным объёмом речевых данных. Затем модель с лучшими характеристиками была сравнена с другими методами синтеза речи. Результатом работы являются генерируемые аудиофайлы и выбор наиболее перспективного метода синтеза речи. Реализованная модель может быть использована для помощи людям с нарушениями зрения, озвучивания маршрутов, оснащения транспортов системами речевого ответа.

The aim of the thesis is to develop a speech synthesizer based on the parametric method. As a result of the research, existing speech generation methods were reviewed, a speech synthesis system based on the parametric method was implemented, and then tested. Mel-spectrograms, convergence between the encoder and decoder, and audio files were also obtained. The information obtained was used to analyze models with different amounts of speech data. Then, the model with the best charac teristics was compared with other speech synthesis methods. The results of the work are the generated audio files and the selection of the most promising speech synthesis method. The implemented model can be used to help people with visual impairments, provide voice guidance for routes, and equip transport with speech response systems.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 0
Last 30 days: 0

Detailed usage statistics