Детальная информация

Название Информационная система транскрибации речи: выпускная квалификационная работа магистра: направление 09.04.02 «Информационные системы и технологии» ; образовательная программа 09.04.02_04 «Системный анализ и оптимизация информационных систем и технологий»
Авторы Шкалев Евгений Владимирович
Научный руководитель Ефремов Артем Александрович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения Санкт-Петербург, 2022
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика Нейронные сети ; Речь — Распознавание ; транскрибация речи ; рекурентные сети ; speech transcribation ; recurrent networks
УДК 004.032.26 ; 004.934.1'1
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 09.04.02
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2023/vr/vr23-465
Права доступа Доступ по паролю из сети Интернет (чтение, печать)
Ключ записи ru\spstu\vkr\20732
Дата создания записи 03.04.2023

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Объектом исследования выступает информационная система транскрибации речи. Целью работы является создание прототипа информационной системы транскрибации речи, которая предоставляет возможность выполнить транскрибацию записи речи пользователей или загруженных аудио файлов. Результатом работы является: 1) обученная модель для транскрибации речи, которая реализована как модель рекуррентных нейронных сетей с использованием библиотеки Tensorflow. 2) RESTful сервис на Python для транскрибации входного аудио файла. 3) RESTfulВеб приложение, которое предоставляет пользовательский веб интерфейс в виде одностраничного приложения, а так же программный интерфейс приложения на основе http для транскрибации речи или аудио файлов. Который написан на языке программирования Java и Javascript и использует базу данных MongoDB. Разработанный прототип может развиваться в следующих направлениях: 1) Добавление авторизации в веб приложение. 2) До обучение рекуррентной модели на новых данных. 3) Предоставление общего API для транскрипции речи. 4) Совершенствование методов транскрибации речи.

The object of the research is the information system of speech transcription. The aim of the work is to create a prototype information system for speech transcription, which provides the ability to perform transcription of a recording of users' speech or downloaded audio files. The result of the work is: 1. a trained model for speech transcription, which is implemented as a recurrent neural network model using the Tensorflow library. 2. RESTful service in Python for transcribing the input audio file. 3. RESTful Web application that provides a web user interface in the form of a single page application, as well as an http-based application API for transcribing speech or audio files. Which is written in the Java and Javascript programming language and uses the MongoDB database. The developed prototype can be developed in the following directions: 1. Adding authorization to the web application. 2. Before training the recurrent model on new data. 3. Providing a common API for speech transcription. 4. Improvement of speech transcription methods.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать
Интернет Анонимные пользователи

Количество обращений: 1 
За последние 30 дней: 0

Подробная статистика