Details
Title | Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи» |
---|---|
Creators | Андреев Иван Дмитриевич |
Scientific adviser | Попов Евгений Александрович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | синтез речи ; рекуррентная нейройная сеть ; долгая краткосрочная память рекуррентной нейройной сети ; двунаправленная ; метрика ; мел-спектограмма ; speech synthesis ; recurrent neural network ; long short-term ; memory of a recurrent neural network ; bidirectional recurrent neural network ; metric ; mel-spectrogram |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 11.03.02 |
Speciality group (FGOS) | 110000 - Электроника, радиотехника и системы связи |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1410 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\36410 |
Record create date | 8/8/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Цель работы – разработка синтезатора речи на основе параметрического метода. В результате исследования были рассмотрены существующие методы генерирования речи, была реализована система синтеза речи на основе параметрического метода, затем протестирована. Также были получены мел- спектрограммы, сходимости между кодировщиком и декодером и аудиофайлы. С помощью полученной информацией происходил анализ моделей с разным объёмом речевых данных. Затем модель с лучшими характеристиками была сравнена с другими методами синтеза речи. Результатом работы являются генерируемые аудиофайлы и выбор наиболее перспективного метода синтеза речи. Реализованная модель может быть использована для помощи людям с нарушениями зрения, озвучивания маршрутов, оснащения транспортов системами речевого ответа.
The aim of the thesis is to develop a speech synthesizer based on the parametric method. As a result of the research, existing speech generation methods were reviewed, a speech synthesis system based on the parametric method was implemented, and then tested. Mel-spectrograms, convergence between the encoder and decoder, and audio files were also obtained. The information obtained was used to analyze models with different amounts of speech data. Then, the model with the best charac teristics was compared with other speech synthesis methods. The results of the work are the generated audio files and the selection of the most promising speech synthesis method. The implemented model can be used to help people with visual impairments, provide voice guidance for routes, and equip transport with speech response systems.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0