Детальная информация
Название | Программная реализация синтеза речи на основе параметрического метода: выпускная квалификационная работа бакалавра: направление 11.03.02 «Инфокоммуникационные технологии и системы связи» ; образовательная программа 11.03.02_01 «Системы мобильной связи» |
---|---|
Авторы | Андреев Иван Дмитриевич |
Научный руководитель | Попов Евгений Александрович |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | синтез речи ; рекуррентная нейройная сеть ; долгая краткосрочная память рекуррентной нейройной сети ; двунаправленная ; метрика ; мел-спектограмма ; speech synthesis ; recurrent neural network ; long short-term ; memory of a recurrent neural network ; bidirectional recurrent neural network ; metric ; mel-spectrogram |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 11.03.02 |
Группа специальностей ФГОС | 110000 - Электроника, радиотехника и системы связи |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1410 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\36410 |
Дата создания записи | 08.08.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Цель работы – разработка синтезатора речи на основе параметрического метода. В результате исследования были рассмотрены существующие методы генерирования речи, была реализована система синтеза речи на основе параметрического метода, затем протестирована. Также были получены мел- спектрограммы, сходимости между кодировщиком и декодером и аудиофайлы. С помощью полученной информацией происходил анализ моделей с разным объёмом речевых данных. Затем модель с лучшими характеристиками была сравнена с другими методами синтеза речи. Результатом работы являются генерируемые аудиофайлы и выбор наиболее перспективного метода синтеза речи. Реализованная модель может быть использована для помощи людям с нарушениями зрения, озвучивания маршрутов, оснащения транспортов системами речевого ответа.
The aim of the thesis is to develop a speech synthesizer based on the parametric method. As a result of the research, existing speech generation methods were reviewed, a speech synthesis system based on the parametric method was implemented, and then tested. Mel-spectrograms, convergence between the encoder and decoder, and audio files were also obtained. The information obtained was used to analyze models with different amounts of speech data. Then, the model with the best charac teristics was compared with other speech synthesis methods. The results of the work are the generated audio files and the selection of the most promising speech synthesis method. The implemented model can be used to help people with visual impairments, provide voice guidance for routes, and equip transport with speech response systems.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0