Детальная информация

Название Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Авторы Борисов Андрей Сергеевич
Научный руководитель Туральчук Константин Анатольевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика llm ; rag ; глубокое чтение ; русская классическая литература ; deep reading ; russian classics
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.03
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1144
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\35686
Дата создания записи 30.07.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В данной работе изложен процесс разработки системы для глубокого чтения классической литературы с контекстными подсказками. В основе системы лежит метод Retrieval-Augmented Generation (RAG), объединяющий векторный поиск по специализированной базе знаний и генерацию ответов с помощью большой языковой модели (LLM). Объектом исследования выступают большие языковые модели, подходы к применению LLM и RAG для формирования контекстуальных пояснений при глубоком чтении литературы. Цель работы — разработать MVP системы, способной по запросу пользователя извлекать из базы знаний наиболее релевантные отрывки и строить на их основе достоверные пояснения к любому фрагменту литературного текста. В работе использованы следующие технологии и программное обеспечение: Java Spring Boot, FastAPI (Python), Next.js, YandexGPT (Yandex Cloud Foundation Models), Managed Qdrant Cloud, Managed PostgreSQL (Yandex Cloud), Object Storage (Yandex Cloud), Redis. Практическая значимость работы определяется растущим запросом на цифровые инструменты глубокого анализа русской классической литературы, которому отвечает разработанная система. Модульная архитектура MVP позволяет быстро адаптировать его как для использования в качестве самостоятельной B2C-платформы, так и для встраивания основного модуля, отвечающего за генерацию RAG-ответов, в существующие образовательные решения — такие как «Арзамас», «Синхронизация» и др.

This paper presents the development process of a system for deep readingof classical literature with contextual hints. The system is based on the Retrieval–Augmented Generation (RAG) method, which combines vector search through a specialized knowledge base with answer generation using a large language model (LLM). The object of the study is large language models and approaches to applying LLM and RAG to generate contextual explanations during deep reading of literature. The goal of the work is to develop an MVP of a system capable of retrieving the most relevant excerpts from the knowledge base upon user request and generating reliable explanations for any fragment of a literary text based on them. The following technologies and software were used in the project: Java Spring Boot, FastAPI (Python), Next.js, YandexGPT (Yandex Cloud Foundation Models), Managed Qdrant Cloud, Managed PostgreSQL (Yandex Cloud), Object Storage (Yandex Cloud), Redis. The practical significance of the work is determined by the growing demand for digital tools for in-depth analysis of Russian classical literature, which the developed system addresses. The modular architecture of the MVP allows for quick adaptation both as a standalone B2C platform and as a component that can be integrated into existing educational solutions — such as ’Arzamas’, ’Synchronization’, and others.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи
  • Разработка системы на основе LLM для глубокого чтения литературных текстов с контекстуальными пояснениями
    • Введение
    • 1. Обзор предметной области
    • 2. Проектирование системы
    • 3. Разработка системы
    • 4. Тестирование и апробация системы
    • Заключение
    • Список сокращений и условных обозначений
    • Список использованных источников
    • Приложение 1 Код RAG Backend
    • Приложение 2 Код BookReader Backend
    • Приложение 3 Код фронтенда
    • Приложение 4 Скрипты ingest-пайплайна

Количество обращений: 1 
За последние 30 дней: 1

Подробная статистика