Details
Title | Разработка нейронной сети для определения длинны разговора по видеозаписи: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта» |
---|---|
Creators | Лячко Алексей Сергеевич |
Scientific adviser | Малеев Олег Геннадьевич |
Other creators | Локшина Екатерина Геннадиевна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2021 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | классификаторы; изображения; речь; сверточные сети; видеозаписи; classifiers; images; speech; convolutional network; videos |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 09.03.04 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
Links | Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований |
DOI | 10.18720/SPBPU/3/2021/vr/vr21-1113 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Record key | ru\spstu\vkr\12852 |
Record create date | 7/16/2021 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
В работе рассматриваются методы обработки видеозаписей, изображений и звука, исследуются способы выявления признаков, виды моделей. В результате была разработана модель, способная классифицировать по кадру из видео, происходит ли на нем разговор. Для демонстрации работы, на основе этой модели, была разработана программа для определения длинны разговора по видеозаписи.
The paper discusses methods of video, audio, imagery and data processing in general, machine learning models and neural network architecture. As a result of the research, the implementation of algorithm based on neural network and capable of detection speech moment by imagery from video only was created. As a prove of concept, program using that algorithm capable of calculating speech time in video was created.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 15
Last 30 days: 0