Details

Title Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Creators Борисов Андрей Сергеевич
Scientific adviser Туральчук Константин Анатольевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects llm ; rag ; глубокое чтение ; русская классическая литература ; deep reading ; russian classics
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.03
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1144
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\35686
Record create date 7/30/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

В данной работе изложен процесс разработки системы для глубокого чтения классической литературы с контекстными подсказками. В основе системы лежит метод Retrieval-Augmented Generation (RAG), объединяющий векторный поиск по специализированной базе знаний и генерацию ответов с помощью большой языковой модели (LLM). Объектом исследования выступают большие языковые модели, подходы к применению LLM и RAG для формирования контекстуальных пояснений при глубоком чтении литературы. Цель работы — разработать MVP системы, способной по запросу пользователя извлекать из базы знаний наиболее релевантные отрывки и строить на их основе достоверные пояснения к любому фрагменту литературного текста. В работе использованы следующие технологии и программное обеспечение: Java Spring Boot, FastAPI (Python), Next.js, YandexGPT (Yandex Cloud Foundation Models), Managed Qdrant Cloud, Managed PostgreSQL (Yandex Cloud), Object Storage (Yandex Cloud), Redis. Практическая значимость работы определяется растущим запросом на цифровые инструменты глубокого анализа русской классической литературы, которому отвечает разработанная система. Модульная архитектура MVP позволяет быстро адаптировать его как для использования в качестве самостоятельной B2C-платформы, так и для встраивания основного модуля, отвечающего за генерацию RAG-ответов, в существующие образовательные решения — такие как «Арзамас», «Синхронизация» и др.

This paper presents the development process of a system for deep readingof classical literature with contextual hints. The system is based on the Retrieval–Augmented Generation (RAG) method, which combines vector search through a specialized knowledge base with answer generation using a large language model (LLM). The object of the study is large language models and approaches to applying LLM and RAG to generate contextual explanations during deep reading of literature. The goal of the work is to develop an MVP of a system capable of retrieving the most relevant excerpts from the knowledge base upon user request and generating reliable explanations for any fragment of a literary text based on them. The following technologies and software were used in the project: Java Spring Boot, FastAPI (Python), Next.js, YandexGPT (Yandex Cloud Foundation Models), Managed Qdrant Cloud, Managed PostgreSQL (Yandex Cloud), Object Storage (Yandex Cloud), Redis. The practical significance of the work is determined by the growing demand for digital tools for in-depth analysis of Russian classical literature, which the developed system addresses. The modular architecture of the MVP allows for quick adaptation both as a standalone B2C platform and as a component that can be integrated into existing educational solutions — such as ’Arzamas’, ’Synchronization’, and others.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous
  • Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями
    • Введение
    • 1. Обзор предметной области
    • 2. Проектирование системы
    • 3. Разработка системы
    • 4. Тестирование и апробация системы
    • Заключение
    • Список сокращений и условных обозначений
    • Список использованных источников
    • Приложение 1 Код RAG Backend
    • Приложение 2 Код BookReader Backend
    • Приложение 3 Код фронтенда
    • Приложение 4 Скрипты ingest-пайплайна

Access count: 1 
Last 30 days: 1

Detailed usage statistics