Details

Title: Разработка модуля анализа долготы пауз и ритма речи для систем компьютерного обучения иностранному языку: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения»
Creators: Тикач Дарья Сергеевна
Scientific adviser: Богач Наталья Владимировна
Other creators: Нестеров Сергей Александрович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2020
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: автоматическое распознавание речи; Kaldi; C++; разбиение на слоги; анализ речи; LibriSpeech; automatic speech recognition; syllabifying; speech analysis
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1161
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\7066

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Выпускная квалификационная работа посвящена разработке модуля анализа долготы пауз и ритма речи для систем компьютерного обучения английскому языку. В ходе работы также рассмотрены современные методы автоматического распознавания речи, исследования по автоматическому определению акцентов и ритму речи. Разработанный модуль позволяет распознавать речь, осуществлять разбиение на слоги с временными отметками и извлекать необходимые для дальнейшего анализа параметры, такие как энергия и длительность слогов. Полученные параметры будут использоваться в системах компьютерного обучения английскому языку для визуализации пользователю и дальнейшего анализа.

The final qualification work is devoted to the development of system for analysing pause duration and speech rhythm for English learning computer systems. In the course of the work modern automatic speech recognition methods and automatic pitch detection researches were reviewed. Developed module allows automatic speech recognition, syllabifying with timestamps and extraction of needed speech parameters such as the energy and syllables duration. Extracted parameters will be used in English learning computer systems for visualisation and future analys.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • УСЛОВНЫЕ ОБОЗНАЧЕНИЯ, ТЕРМИНЫ И СОКРАЩЕНИЯ
  • ВВЕДЕНИЕ
  • ИСПОЛЬЗОВАНИЕ СКРЫТЫХ МАРКОВСКИХ МОДЕЛЕЙ ПРИ РАСПОЗНАВАНИИ РЕЧИ
    • Подготовка данных
  • ОПРЕДЕЛЕНИЕ РИТМА РЕЧИ НА УРОВНЕ СЛОВА, СЛОГА И ГЛАСНЫХ В РЕЧИ
  • ОПИСАНИЕ РАЗРАБАТЫВАЕМОГО МОДУЛЯ
    • Выбор ASR-библиотеки
    • Выбор ASR-модели
    • Структура входных и выходных данных
    • Подключение библиотек
    • Архитектура проекта
  • РАЗРАБОТКА
    • Подготовка входных аудиофайлов к распознаванию
    • Извлечение признаков звуковых сигналов
    • Построение декодирующего графа
    • Декодирование звуковых сигналов
    • Разбиение на слоги
    • Выбор алгоритма разбиения
    • Анализ полученного разбиения
  • ТЕСТИРОВАНИЕ
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ. ЛИСТИНГИ КОДА

Usage statistics

stat Access count: 4
Last 30 days: 0
Detailed usage statistics