Детальная информация

Название Разработка end-to-end системы распознавания речи: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Авторы Семенова София Константиновна
Научный руководитель Богач Наталья Владимировна
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика распознавание речи ; русский язык ; end-to-end модель ; преобразование аудиосигнала ; коэффициент ошибок ; глубокое обучение ; speech recognition ; russian language ; end-to-end model ; audio signal conversion ; error rate ; deep learning
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.01
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-2982
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\37234
Дата создания записи 19.09.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена разработке end-to-end системы распознавания русской речи на основе архитектуры Transformer. Входными данными для си-стемы служат аудиозаписи русского языка, которые преобразуются в текстовую форму. Особое внимание уделено особенностям обработки русскоязычных аудиосигналов и построению модели, способной эффективно работать с такими данными. В процессе работы был проведён анализ и исследование современных ре-шений и методов автоматического распознавания речи. Это позволило выделить наиболее эффективные подходы и технологии, которые учитывались при выборе архитектуры и реализации модели, обеспечивая её эффективность. Была реализована и обучена модель на основе Transformer, адаптированная под специфику русского языка. Обучение проводилось на открытых датасетах CommonVoice и OpenSTT. В результате тестирования была достигнута точность WER = 22% и CER = 6%, что подтверждает работоспособность разработанного решения. Полученные результаты могут быть использованы при построении прикладных систем автоматического преобразования речи в текст и внедрении речевых интерфейсов в различные цифровые продукты.

This work is devoted to the development of an end-to-end Russian speech recognition system based on the Transformer architecture. The input data for the sys-tem is audio recordings of the Russian language, which are converted into text form. Special attention is paid to the specifics of processing Russian-language audio signals and building a model capable of efficiently working with such data. In the course of the work, the analysis and research of modern solutions and methods of automatic speech recognition was carried out. This allowed us to identify the most effective approaches and technologies that were taken into account when choosing the architecture and implementing the model, ensuring its effectiveness. A Transformer-based model was implemented and trained, adapted to the spe-cifics of the Russian language. The training was conducted on the open datasets CommonVoice and OpenSTT. As a result of testing, the accuracy of WER = 22% and CER = 6% was achieved, which confirms the operability of the developed solution. The results obtained can be used in the construction of applied systems for automatic speech-to-text conversion and the implementation of speech interfaces in various digi-tal products.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика