Details
Title | Разработка вопросно-ответной системы GraphRAG с использованием графовой базы данных и больших языковых моделей: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом» |
---|---|
Creators | Клинов Павел Александрович |
Scientific adviser | Гейда Александр Сергеевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | вопросно-ответная система ; GraphRAG ; RAG ; LLM ; извлечение именованных сущностей ; графовая база данных ; оценка качества ; question-answer system ; named entities extraction ; graph database ; quality assessment |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.04 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2025 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\35342 |
Record create date | 7/10/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Цель работы заключается в проектировании, реализации и экспериментальной оценке прототипа GraphRAG, для повышения качества ответов на сложные запросы путем объединения знаний из графовой БД и возможностей LLM. Были решены следующие задачи: – проведен анализ подходов к построению вопросно-ответных систем; – изучены отечественные и зарубежные исследования в данной области; – разработана архитектура системы GraphRAG, включающая интеграцию графовых структур с алгоритмами обработки естественного языка; – реализован прототип системы; – проведены эксперименты для оценки эффективности предложенного решения. Актуальность темы обусловлена ростом объемов данных, ограниченной эффективностью существующих вопросно-ответных систем, а также потребностью российской компаний в решениях, адаптированных к обработке текстов на русском языке и учитывающих специфику локальных бизнес-процессов. Интеграция графовых баз данных с большими языковыми моделями открывает новые перспективы для обработки информации и извлечения скрытых взаимосвязей. Источниками информации выступили научные статьи отечественных и зарубежных авторов, посвященные разработке вопросно-ответных систем, графовым базам данных, большим языковым моделям, а также материалы из открытых источников и техническая документация по используемым технологиям. В результате исследования была разработана вопросно-ответная система GraphRAG, продемонстрировавшая в ходе экспериментальной оценки более высокую точность, полноту и релевантность ответов по сравнению с традиционными RAG-системами и базовыми LLM. Предложенная архитектура и алгоритмы могут быть применены для создания интеллектуальных систем анализа данных и управления знаниями в различных предметных областях.
The purpose of the work is to design, implement and experimentally evaluate the GraphRAG prototype to improve the quality of responses to complex queries by combining knowledge from the graph database and LLM capabilities. The following tasks were solved: – an analysis of approaches to the construction of question-and-answer systems was carried out; – domestic and foreign studies in this field have been studied; – the GraphRAG system architecture has been developed, including the integration of graph structures with natural language processing algorithms; – a prototype of the system has been implemented; – experiments have been conducted to evaluate the effectiveness of the proposed solution. The relevance of the topic is due to the growing volume of data, the limited effectiveness of existing question-and-answer systems, as well as the need for Russian companies in solutions adapted to text processing in Russian and taking into account the specifics of local business processes. The integration of graph databases with large language models opens up new perspectives for information processing and the extraction of hidden relationships. The sources of information were scientific articles by domestic and foreign authors devoted to the development of question-and-answer systems, graph databases, large language models, as well as materials from open sources and technical documentation on the technologies used. As a result of the research, the GraphRAG question-and-answer system was developed, which demonstrated higher accuracy, completeness and relevance of answers during the experimental evaluation compared to traditional RAG systems and basic LLMs. The proposed architecture and algorithms can be applied to create intelligent data analysis and knowledge management systems in various subject areas.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0