Details

Title Поиск и индексация документов с использованием мультимодального RAG: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта»
Creators Поволяев Андрей Дмитриевич
Scientific adviser Петров Александр Владимирович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects архитектура rag ; мультимодальность ; векторный поиск ; большие языковые модели ; python ; colpali ; qdrant ; rag architecture ; multimodality ; vector search ; large language models
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1153
Rights Доступ по паролю из сети Интернет (чтение, печать)
Additionally New arrival
Record key ru\spstu\vkr\35788
Record create date 7/30/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена созданию пайплайна для эффективного поиска и хранения документов в векторной базе данных с использованием архитектуры генерации, дополненный поиском (RAG). В ходе работы был проведен анализ существующих решений, рассмотрены их основные преимущества и недостатки. Выяснилось, что некоторые из решений не являются мультимодальными, и, что самое главное, ни одно из них не гарантирует конфиденциальность данных и возможность работать с единой БД. В процессе работы была реализована система, которая позволяет загружать документы, осуществлять быстрый поиск и получать релевантный ответ на запрос пользователя. Система была развернута с использованием контейнеризации на базе Docker. Было проведено тестирование и оценка с помощью метрик, предоставляемых фреймворком Deepeval. Также было произведено сравнение разработанной системы с ведущей большой мультимодальной языковой моделью – GPT-4o.

This work is devoted to creating a pipeline for efficient document search and storage in a vector database using a architecture retrieval-augmented-generation (RAG). In the course of the work, an analysis of existing solutions was carried out, their main advantages and disadvantages were considered. It turned out that some of the solutions are not multimodal, and, most importantly, none of them guarantees data confidentiality and the ability to work with a single database. In the process, a system was implemented that allows to upload documents, perform a quick search and receive a relevant response to a users request. The system was deployed using Docker-based containerization. Testing and evaluation were conducted using metrics provided by the Deepeval framework. The developed system was also compared with the leading large multimodal language model, GPT-4o.

Network User group Action
ILC SPbPU Local Network All
Read Print
Internet Authorized users SPbPU
Read Print
Internet Anonymous
  • ВВЕДЕНИЕ
  • ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ И ОБОСНОВАНИЕ АКТУАЛЬНОСТИ РАБОТЫ
    • 1.1 Постановка задачи
    • 1.2 Обоснование актуальности работы
  • ГЛАВА 2. ОБЗОР СУЩЕСТВУЮЩИХ ПОДХОДОВ И РЕШЕНИЙ
    • 2.1 Анализ существующих теоретических подходов
    • 2.2 Анализ существующих решений
  • ГЛАВА 3. ТЕХНИЧЕСКОЕ ПРОЕКТИРОВАНИЕ СИСТЕМЫ
    • 3.1 Функциональные требования к системе
    • 3.2 Нефункциональные требования к системе
    • 3.3 Обоснование выбора технологий и средств разработки
    • 3.4 Обоснование архитектурных решений
  • ГЛАВА 4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ И ТЕСТИРОВАНИЕ
    • 4.1 Программная реализация
    • 4.2 Сборка системы
    • 4.3 Тестирование и оценка системы
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Access count: 0 
Last 30 days: 0

Detailed usage statistics