Details
Title | Поиск и индексация документов с использованием мультимодального RAG: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта» |
---|---|
Creators | Поволяев Андрей Дмитриевич |
Scientific adviser | Петров Александр Владимирович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | архитектура rag ; мультимодальность ; векторный поиск ; большие языковые модели ; python ; colpali ; qdrant ; rag architecture ; multimodality ; vector search ; large language models |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 09.03.04 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1153 |
Rights | Доступ по паролю из сети Интернет (чтение, печать) |
Additionally | New arrival |
Record key | ru\spstu\vkr\35788 |
Record create date | 7/30/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Данная работа посвящена созданию пайплайна для эффективного поиска и хранения документов в векторной базе данных с использованием архитектуры генерации, дополненный поиском (RAG). В ходе работы был проведен анализ существующих решений, рассмотрены их основные преимущества и недостатки. Выяснилось, что некоторые из решений не являются мультимодальными, и, что самое главное, ни одно из них не гарантирует конфиденциальность данных и возможность работать с единой БД. В процессе работы была реализована система, которая позволяет загружать документы, осуществлять быстрый поиск и получать релевантный ответ на запрос пользователя. Система была развернута с использованием контейнеризации на базе Docker. Было проведено тестирование и оценка с помощью метрик, предоставляемых фреймворком Deepeval. Также было произведено сравнение разработанной системы с ведущей большой мультимодальной языковой моделью – GPT-4o.
This work is devoted to creating a pipeline for efficient document search and storage in a vector database using a architecture retrieval-augmented-generation (RAG). In the course of the work, an analysis of existing solutions was carried out, their main advantages and disadvantages were considered. It turned out that some of the solutions are not multimodal, and, most importantly, none of them guarantees data confidentiality and the ability to work with a single database. In the process, a system was implemented that allows to upload documents, perform a quick search and receive a relevant response to a users request. The system was deployed using Docker-based containerization. Testing and evaluation were conducted using metrics provided by the Deepeval framework. The developed system was also compared with the leading large multimodal language model, GPT-4o.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- ВВЕДЕНИЕ
- ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ И ОБОСНОВАНИЕ АКТУАЛЬНОСТИ РАБОТЫ
- 1.1 Постановка задачи
- 1.2 Обоснование актуальности работы
- ГЛАВА 2. ОБЗОР СУЩЕСТВУЮЩИХ ПОДХОДОВ И РЕШЕНИЙ
- 2.1 Анализ существующих теоретических подходов
- 2.2 Анализ существующих решений
- ГЛАВА 3. ТЕХНИЧЕСКОЕ ПРОЕКТИРОВАНИЕ СИСТЕМЫ
- 3.1 Функциональные требования к системе
- 3.2 Нефункциональные требования к системе
- 3.3 Обоснование выбора технологий и средств разработки
- 3.4 Обоснование архитектурных решений
- ГЛАВА 4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ И ТЕСТИРОВАНИЕ
- 4.1 Программная реализация
- 4.2 Сборка системы
- 4.3 Тестирование и оценка системы
- ЗАКЛЮЧЕНИЕ
- СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Access count: 0
Last 30 days: 0