Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи»

Андреев, Иван Дмитриевич

Детальная информация

Название	Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи»
Авторы	Андреев Иван Дмитриевич
Научный руководитель	Попов Евгений Александрович
Организация	Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций
Выходные сведения	Санкт-Петербург, 2025
Коллекция	Выпускные квалификационные работы ; Общая коллекция
Тематика	синтез речи ; рекуррентная нейройная сеть ; долгая краткосрочная память рекуррентной нейройной сети ; двунаправленная ; метрика ; мел-спектограмма ; speech synthesis ; recurrent neural network ; long short-term ; memory of a recurrent neural network ; bidirectional recurrent neural network ; metric ; mel-spectrogram
Тип документа	Выпускная квалификационная работа бакалавра
Тип файла	PDF
Язык	Русский
Уровень высшего образования	Бакалавриат
Код специальности ФГОС	11.03.02
Группа специальностей ФГОС	110000 - Электроника, радиотехника и системы связи
DOI	10.18720/SPBPU/3/2025/vr/vr25-1410
Права доступа	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно	Новинка
Ключ записи	ru\spstu\vkr\36410
Дата создания записи	08.08.2025

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

Цель работы – разработка синтезатора речи на основе параметрического метода. В результате исследования были рассмотрены существующие методы генерирования речи, была реализована система синтеза речи на основе параметрического метода, затем протестирована. Также были получены мел- спектрограммы, сходимости между кодировщиком и декодером и аудиофайлы. С помощью полученной информацией происходил анализ моделей с разным объёмом речевых данных. Затем модель с лучшими характеристиками была сравнена с другими методами синтеза речи. Результатом работы являются генерируемые аудиофайлы и выбор наиболее перспективного метода синтеза речи. Реализованная модель может быть использована для помощи людям с нарушениями зрения, озвучивания маршрутов, оснащения транспортов системами речевого ответа.

The aim of the thesis is to develop a speech synthesizer based on the parametric method. As a result of the research, existing speech generation methods were reviewed, a speech synthesis system based on the parametric method was implemented, and then tested. Mel-spectrograms, convergence between the encoder and decoder, and audio files were also obtained. The information obtained was used to analyze models with different amounts of speech data. Then, the model with the best charac teristics was compared with other speech synthesis methods. The results of the work are the generated audio files and the selection of the most promising speech synthesis method. The implemented model can be used to help people with visual impairments, provide voice guidance for routes, and equip transport with speech response systems.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

Количество обращений: 0
За последние 30 дней: 0

Подробная статистика