Детальная информация

Название Optimizing the Process of Subtitling Educational Videos with Machine Translation Algorithms: выпускная квалификационная работа магистра: направление 45.04.04 «Интеллектуальные системы в гуманитарной среде» ; образовательная программа 45.04.04_01 «Цифровая лингвистика (международная образовательная программа)/Digital Linguistics (International Educational Program)»
Авторы Лаврентьева Екатерина Петровна
Научный руководитель Коган Марина Самуиловна
Организация Санкт-Петербургский политехнический университет Петра Великого. Гуманитарный институт
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика subtitling; audiovisual texts; educational videos; machine translation; audiovisual translation
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 45.04.04
Группа специальностей ФГОС 450000 - Языкознание и литературоведение
DOI 10.18720/SPBPU/3/2024/vr/vr24-5800
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\33248
Дата создания записи 29.08.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

The graduate qualification work investigates the possibility of integrating machine translation algorithms into the task of subtitling educational video content and, in particular, into the process of creating high-quality English subtitles for Russian video lectures on linguistics from the YouTube channel Postnauka. The method chosen to improve the quality of machine translation-generated subtitles for the lectures is fine-tuning a machine translation model on a large genre-specific corpus of video lecture subtitles. A number of theoretical issues was studied to better understand the problem of automatically subtitling educational videos, such as the nature of the audiovisual text and one of its genres, the educational video, the specifics of audiovisual translation (AVT) and subtitling, and the evolution of and the state-of-the-art in machine translation (MT) algorithms. Previous work in the research area of applying MT in the task of AVT were analyzed and drawn upon. As a result of conducting the experimental study, it was determined that machine translation models translate subtitles coherently when their formatting is changed to the format one line = one sentence. The translation is adequate and fluent except for terminology, which the models struggle to recognize and translate correctly in many cases. After the model was fine-tuned, it started recognizing more terms. These conclusions prove that it is possible to apply machine translation algorithms to subtitling educational videos; however, some pre-editing needs to be done, such as changing the format of the text. The quality of term translation can be improved by augmenting the training corpus with domain-specific data, which is often done with the help of back-translation.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 4 
За последние 30 дней: 2

Подробная статистика