Детальная информация

Название: Разработка модуля анализа долготы пауз и ритма речи для систем компьютерного обучения иностранному языку: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Авторы: Тикач Дарья Сергеевна
Научный руководитель: Богач Наталья Владимировна
Другие авторы: Нестеров Сергей Александрович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: автоматическое распознавание речи; Kaldi; C++; разбиение на слоги; анализ речи; LibriSpeech; automatic speech recognition; syllabifying; speech analysis
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1161
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\7066

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Выпускная квалификационная работа посвящена разработке модуля анализа долготы пауз и ритма речи для систем компьютерного обучения английскому языку. В ходе работы также рассмотрены современные методы автоматического распознавания речи, исследования по автоматическому определению акцентов и ритму речи. Разработанный модуль позволяет распознавать речь, осуществлять разбиение на слоги с временными отметками и извлекать необходимые для дальнейшего анализа параметры, такие как энергия и длительность слогов. Полученные параметры будут использоваться в системах компьютерного обучения английскому языку для визуализации пользователю и дальнейшего анализа.

The final qualification work is devoted to the development of system for analysing pause duration and speech rhythm for English learning computer systems. In the course of the work modern automatic speech recognition methods and automatic pitch detection researches were reviewed. Developed module allows automatic speech recognition, syllabifying with timestamps and extraction of needed speech parameters such as the energy and syllables duration. Extracted parameters will be used in English learning computer systems for visualisation and future analys.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • УСЛОВНЫЕ ОБОЗНАЧЕНИЯ, ТЕРМИНЫ И СОКРАЩЕНИЯ
  • ВВЕДЕНИЕ
  • ИСПОЛЬЗОВАНИЕ СКРЫТЫХ МАРКОВСКИХ МОДЕЛЕЙ ПРИ РАСПОЗНАВАНИИ РЕЧИ
    • Подготовка данных
  • ОПРЕДЕЛЕНИЕ РИТМА РЕЧИ НА УРОВНЕ СЛОВА, СЛОГА И ГЛАСНЫХ В РЕЧИ
  • ОПИСАНИЕ РАЗРАБАТЫВАЕМОГО МОДУЛЯ
    • Выбор ASR-библиотеки
    • Выбор ASR-модели
    • Структура входных и выходных данных
    • Подключение библиотек
    • Архитектура проекта
  • РАЗРАБОТКА
    • Подготовка входных аудиофайлов к распознаванию
    • Извлечение признаков звуковых сигналов
    • Построение декодирующего графа
    • Декодирование звуковых сигналов
    • Разбиение на слоги
    • Выбор алгоритма разбиения
    • Анализ полученного разбиения
  • ТЕСТИРОВАНИЕ
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ. ЛИСТИНГИ КОДА

Статистика использования

stat Количество обращений: 4
За последние 30 дней: 0
Подробная статистика