Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»

Борисов, Андрей Сергеевич

Details

Title	Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Creators	Борисов Андрей Сергеевич
Scientific adviser	Туральчук Константин Анатольевич
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint	Санкт-Петербург, 2025
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	llm ; rag ; глубокое чтение ; русская классическая литература ; deep reading ; russian classics
Document type	Bachelor graduation qualification work
File type	PDF
Language	Russian
Level of education	Bachelor
Speciality code (FGOS)	09.03.03
Speciality group (FGOS)	090000 - Информатика и вычислительная техника
DOI	10.18720/SPBPU/3/2025/vr/vr25-1144
Rights	Доступ по паролю из сети Интернет (чтение)
Additionally	New arrival
Record key	ru\spstu\vkr\35686
Record create date	7/30/2025

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

В данной работе изложен процесс разработки системы для глубокого чтения классической литературы с контекстными подсказками. В основе системы лежит метод Retrieval-Augmented Generation (RAG), объединяющий векторный поиск по специализированной базе знаний и генерацию ответов с помощью большой языковой модели (LLM). Объектом исследования выступают большие языковые модели, подходы к применению LLM и RAG для формирования контекстуальных пояснений при глубоком чтении литературы. Цель работы — разработать MVP системы, способной по запросу пользователя извлекать из базы знаний наиболее релевантные отрывки и строить на их основе достоверные пояснения к любому фрагменту литературного текста. В работе использованы следующие технологии и программное обеспечение: Java Spring Boot, FastAPI (Python), Next.js, YandexGPT (Yandex Cloud Foundation Models), Managed Qdrant Cloud, Managed PostgreSQL (Yandex Cloud), Object Storage (Yandex Cloud), Redis. Практическая значимость работы определяется растущим запросом на цифровые инструменты глубокого анализа русской классической литературы, которому отвечает разработанная система. Модульная архитектура MVP позволяет быстро адаптировать его как для использования в качестве самостоятельной B2C-платформы, так и для встраивания основного модуля, отвечающего за генерацию RAG-ответов, в существующие образовательные решения — такие как «Арзамас», «Синхронизация» и др.

This paper presents the development process of a system for deep readingof classical literature with contextual hints. The system is based on the Retrieval–Augmented Generation (RAG) method, which combines vector search through a specialized knowledge base with answer generation using a large language model (LLM). The object of the study is large language models and approaches to applying LLM and RAG to generate contextual explanations during deep reading of literature. The goal of the work is to develop an MVP of a system capable of retrieving the most relevant excerpts from the knowledge base upon user request and generating reliable explanations for any fragment of a literary text based on them. The following technologies and software were used in the project: Java Spring Boot, FastAPI (Python), Next.js, YandexGPT (Yandex Cloud Foundation Models), Managed Qdrant Cloud, Managed PostgreSQL (Yandex Cloud), Object Storage (Yandex Cloud), Redis. The practical significance of the work is determined by the growing demand for digital tools for in-depth analysis of Russian classical literature, which the developed system addresses. The modular architecture of the MVP allows for quick adaptation both as a standalone B2C platform and as a component that can be integrated into existing educational solutions — such as ’Arzamas’, ’Synchronization’, and others.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями
- Введение
- 1. Обзор предметной области
- 2. Проектирование системы
- 3. Разработка системы
- 4. Тестирование и апробация системы
- Заключение
- Список сокращений и условных обозначений
- Список использованных источников
- Приложение 1 Код RAG Backend
- Приложение 2 Код BookReader Backend
- Приложение 3 Код фронтенда
- Приложение 4 Скрипты ingest-пайплайна

Access count: 1
Last 30 days: 1

Detailed usage statistics