Details
Title | Разработка программного продукта для автогенерации тайм-кодов для видео с использованием LLM: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения» |
---|---|
Creators | Михайлов Алексей Евгеньевич |
Scientific adviser | Семенов Константин Константинович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | микросервис ; Java ; Python ; искусственный интеллект ; LLM ; таймкоды ; microservice ; artificial intelligence ; timestamps |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 09.03.01 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2976 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37228 |
Record create date | 9/19/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена разработке системы на основе микросервисов с использованием LLM, для автогенерации тайм-кодов к аудиозаписям и видеороликам. Задачи, которые решались в ходе разработки, включали в себя следующее: 1)анализ существующих решений и инструментов, применяемых для обработки мультимедийных данных, 2)сравнение различных подходов, их точности, эффективности и ограничений, 3)разработку, апробацию и тестирование программного продукта для генерации таймкодов для видеоматериалов открытого доступа. В результате сбора и анализа информации были выбраны технологии, которые использовались для реализации приложения: Java, Python, Spring, Docker, Django, YandexGPT. В ходе работы были реализованы 4 микросервиса для автогенерации тайм-кодов к аудиозаписям и видеороликами. Один необходим как точка входа из внешнего мира и сервис для маршрутизации запросов пользователей, второй микросервис нужен для управления пользователями системы, третий - хранение пользовательских данных, а четвертый – сервис для транскрибации и автогенерации.
This work is devoted to the development of a system based on microservices using LLM for auto-generation of timestamps for audio recordings and videos. Problems that were solved during development: 1)analysis of existing solutions and tools used for multimedia timestamps generation, 2)comparison of different approaches, their accuracy, effectiveness, and limitations. 3)development, approbation and testing of a software product for generating timecodes for open access video materials. As a result, the technologies used for application development were selected: Java, Python, Spring, Docker, Django, YandexGPT. In the course of the work, 4 microservices were implemented for auto-generation of timecodes for audio recordings and videos. One is needed as an entry point from the outside world and a service for routing user requests, the second microservice is needed for managing system users, the third is storing user data, and the fourth is a service for transcription and auto-generation.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- На 46 с., 33 рисунков, 1 таблица, 1 приложение.
- Введение
- Глава 1. Существующие решения и конкуренты
- 1.1.Instant Chapters
- 1.2. VidChapter
- 1.3. Microsoft Videl Indexer
- 1.4. Сравнение
- Глава 2. Подход к решению задачи
- Глава 3. Инструменты и технологии, используемые пр
- Обоснование выбора технологического стека заключае
- Python был выбран как основной язык для реализации
- Преимущества Python заключаются в следующем.
- 1) Богатая экосистема ИИ-библиотек: доступны такие
- 2) Удобство прототипирования: Python позволяет быс
- После выбора стека технологий определим компоненты
- Глава 4. Перечень разработанных программных компон
- 4.1.GatewayApiService
- 4.2. AuthorizationService
- 4.3. MainEditorService
- 4.4. AIEditorService
- Глава 5. Тестирование
- 5.1. Регистрация пользователя
- 5.2. Аутентификация пользователя:
- 5.3. Обновление и валидация токенов
- 5.4. Тестирование основной бизнес логики приложени
- 5.5. Нагрузочное тестирование
- 5.5.1. Вычисленный Response time, Requests/sec, ис
- 5.5.2. Вычисленный Response time, Requests/sec, ис
- 5.5.3. Вычисленный Response time, Requests/sec, ис
- Заключение
- Список использованных источников
- ПРИЛОЖЕНИЯ
Access count: 0
Last 30 days: 0