Детальная информация

Название: Анализ систем распознавания речи: выпускная квалификационная работа бакалавра: направление 11.03.04 «Электроника и наноэлектроника» ; образовательная программа 11.03.04_05 «Радиофизика и электроника»
Авторы: Ли Юй
Научный руководитель: Попов Евгений Александрович
Другие авторы: Савченко Екатерина
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт физики, нанотехнологий и телекоммуникаций
Выходные сведения: Санкт-Петербург, 2021
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: распознавание речи; акустическая модель; нейронная сеть; cсистема Kaldi; нейронная сеть с временной задержкой (TDNN); speech recognition; acoustic model; neural network; Kaldi; time delay neural network (TDNN)
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 11.03.04
Группа специальностей ФГОС: 110000 - Электроника, радиотехника и системы связи
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-3771
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\13069

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В работе исследовалось функционирование системы распознавания речи Kaldi под управлением операционной системы Linux. Библиотека данных китайского языка с открытым исходным кодом была загружена из Интернета и обучена с использованием акустических моделей, таких, как Mono DNN, для получения WER (word Error Rate) и использования его для оценки производительность системы ASR.

In this work, the Kaldi speech recognition system was created on a Linux system, and the open source Chinese corpus was downloaded from the Internet and trained using acoustic models such as Mono DNN to derive the WER (word Error Rate) and use it to evaluate ASR system performance.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 6
За последние 30 дней: 0
Подробная статистика