Детальная информация
Название | Optimizing the Process of Subtitling Educational Videos with Machine Translation Algorithms: выпускная квалификационная работа магистра: направление 45.04.04 «Интеллектуальные системы в гуманитарной среде» ; образовательная программа 45.04.04_01 «Цифровая лингвистика (международная образовательная программа)/Digital Linguistics (International Educational Program)» |
---|---|
Авторы | Лаврентьева Екатерина Петровна |
Научный руководитель | Коган Марина Самуиловна |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Гуманитарный институт |
Выходные сведения | Санкт-Петербург, 2024 |
Коллекция | Выпускные квалификационные работы; Общая коллекция |
Тематика | subtitling; audiovisual texts; educational videos; machine translation; audiovisual translation |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 45.04.04 |
Группа специальностей ФГОС | 450000 - Языкознание и литературоведение |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-5800 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\33248 |
Дата создания записи | 29.08.2024 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
The graduate qualification work investigates the possibility of integrating machine translation algorithms into the task of subtitling educational video content and, in particular, into the process of creating high-quality English subtitles for Russian video lectures on linguistics from the YouTube channel Postnauka. The method chosen to improve the quality of machine translation-generated subtitles for the lectures is fine-tuning a machine translation model on a large genre-specific corpus of video lecture subtitles. A number of theoretical issues was studied to better understand the problem of automatically subtitling educational videos, such as the nature of the audiovisual text and one of its genres, the educational video, the specifics of audiovisual translation (AVT) and subtitling, and the evolution of and the state-of-the-art in machine translation (MT) algorithms. Previous work in the research area of applying MT in the task of AVT were analyzed and drawn upon. As a result of conducting the experimental study, it was determined that machine translation models translate subtitles coherently when their formatting is changed to the format one line = one sentence. The translation is adequate and fluent except for terminology, which the models struggle to recognize and translate correctly in many cases. After the model was fine-tuned, it started recognizing more terms. These conclusions prove that it is possible to apply machine translation algorithms to subtitling educational videos; however, some pre-editing needs to be done, such as changing the format of the text. The quality of term translation can be improved by augmenting the training corpus with domain-specific data, which is often done with the help of back-translation.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 4
За последние 30 дней: 2