Details
Title | Интеллектуальный помощник на основе LLM для оптимизации процессов на производстве: выпускная квалификационная работа магистра: направление 01.04.03 «Механика и математическое моделирование» ; образовательная программа 01.04.03_03 «Механика и цифровое производство» |
---|---|
Creators | Логинов Александр Кириллович |
Scientific adviser | Ле-Захаров Александр Аневич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | интеллектуальный помощник ; большие языковые модели ; retrieval-augmented generation ; оптимизация процессов ; производственная документация ; цитирование источников ; локальная обработка данных ; intelligent assistant ; large language models ; process optimization ; production documentation ; source citation ; local data processing ; llm |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 01.04.03 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3630 |
Rights | Доступ по паролю из сети Интернет (чтение, печать) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37400 |
Record create date | 9/19/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Работа посвящена разработке и исследованию интеллектуальной системы на основе больших языковых моделей (LLM) и архитектуры Retrieval-Augmented Generation (RAG), оптимизирующей работу с производственной и нормативной документацией. Целью является создание эффективной и прозрачной системы для генерации точных ответов с цитированием источников и возможностью локального развертывания для обеспечения безопасности корпоративных данных. Методика включает обзор современных LLM, проектирование многокомпонентной RAG-архитектуры (предобработка и индексация документов с парсингом, фрагментацией и векторизацией) и расширенные техники обработки запросов, включая интеллектуальное переписывание запросов, Hypothetical Document Embeddings (HyDE), Parent Page Retrieval и переранжирование ответов с помощью LLM. Основной моделью выбрана Gemma-3-4B. Результатом стал прототип системы, эффективно обрабатывающий документацию и генерирующий ответы с указанием источников. Результаты подтверждают эффективность архитектуры и применённых техник, а также потенциал интеграции в корпоративные системы управления знаниями.
The work is devoted to the development and research of an intelligent system based on large language models (LLM) and Retrieval-Augmented Generation (RAG) architecture that optimizes the work with production and regulatory documentation. The goal is to create an efficient and transparent system for generating accurate answers with source citation and local deployment capability to secure corporate data. The methodology includes a review of state-of-the-art LLMs, design of a multi-component RAG architecture (document preprocessing and indexing with parsing, fragmentation and vectorization) and advanced query processing techniques including intelligent query rewriting, Hypothetical Document Embeddings (HyDE), Parent Page Retrieval and LLM-assisted response reranking. Gemma-3-4B was chosen as the basic model. The result is a prototype system that efficiently processes documentation and generates source-identified responses. The results confirm the effectiveness of the architecture and the applied techniques, as well as the potential for integration into corporate knowledge management systems.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0