Details

Title Разработка системы тестирования для профессионального роста сотрудников предприятия с использованием языковых моделей и RAG подхода: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта»
Creators Хураськин Петр Алексеевич
Scientific adviser Дробинцев Дмитрий Федорович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects генерация вопросов ; проверка ответов ; языковая модель ; rag ; асинхронная обработка ; искусственный интеллект ; question generation ; answer verification ; language model ; asynchronous processing ; artificial intelligence
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1517
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\35725
Record create date 7/30/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная выпускная квалификационная работа посвящена разработке системы для автоматизации генерации вопросов, проверки ответов и управления контентом с использованием технологий искусственного интеллекта и подхода Retrieval-Augmented Generation (RAG). Целью работы является создание инструмента для упрощения тестирования знаний сотрудников в образовательной и корпоративной среде. Методология разработки включает анализ требований, проектирование масштабируемой архитектуры с использованием FastAPI, PostgreSQL и Apache Kafka, дообучение языковой модели ruT5-small на датасете SberQuad, а также интеграцию с RAG для генерации контекстно-релевантных вопросов. Использованы библиотеки txtai, SentenceTransformers и Transformers для обработки текста, сравнения ответов и генерации вопросов. Разработанная система предоставляет REST API для генерации вопросов, проверки ответов с использованием косинусного сходства и управления контентом. Тестирование в реальных условиях подтвердило высокую точность генерации вопросов и производительность системы при обработке больших объемов данных, однако выявило необходимость оптимизации времени генерации и разработки веб-интерфейса. Результаты работы могут быть применены в образовательных учреждениях, онлайн-курсах и корпоративных системах обучения для автоматизации создания тестов и оценки знаний.

This final qualification work is dedicated to the development of a system for automating question generation, answer verification, and content management using artificial intelligence technologies and the Retrieval-Augmented Generation (RAG) approach. The aim is to create a tool to simplify employee knowledge testing in educational and corporate environments. The methodology includes requirements analysis, designing a scalable architecture using FastAPI, PostgreSQL, and Apache Kafka, fine-tuning the ruT5-small language model on the SberQuad dataset, and integrating RAG for generating contextually relevant questions. Libraries such as txtai, SentenceTransformers, and Transformers were used for text processing, answer comparison, and question generation. The developed system provides a REST API for question generation, answer verification using cosine similarity, and content management. Real-world testing confirmed high accuracy in question generation and system performance under high data loads, though it highlighted the need for faster generation and a web interface. The results can be applied in educational institutions, online courses, and corporate training systems for automated test creation and knowledge assessment.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics