Details

Title Разработка программного обеспечения для автоматического формирования запросов к базе данных на основе текстового описания задачи: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем»
Creators Нгунга Нджоя Чарльз Эммануэль
Scientific adviser Сабинин Олег Юрьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects интеллектуальные системы ; большие языковые модели ; обработка естественного языка ; генерация sql ; машинное обучение ; базы данных ; intelligent systems ; large language models ; natural language processing ; sql generation ; machine learning ; databases
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 02.04.03
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2025/vr/vr25-4342
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\38967
Record create date 9/24/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

В работе представлен подход к проектированию и экспериментальному исследованию интеллектуальной системы, преобразующей естественно-языковые запросы в SQL-запросы для реляционных баз данных с применением больших языковых моделей (LLM). Рассмотрены основные аспекты обработки естественного языка (NLP) и возможности современных LLM. Выделены как преимущества, так и ограничения подхода на основе LLM, включая способность к обобщению новых типов запросов и сложности при работе с неоднозначными или неполными пользовательскими формулировками. Предложена и реализована архитектура интеллектуальной системы, включающая серверную часть на Node.js с интеграцией моделей Groq/OpenAI и пользовательский интерфейс на React. Система адаптирована для работы с русскоязычными запросами и поддерживает динамическое извлечение схемы из базы данных PostgreSQL. Проведено тестирование производительности системы, включая оценку точности и скорости генерации SQL-запросов для различных типов пользовательских запросов. Выполнено сравнительное экспериментальное исследование с шаблонными и эвристическими методами. Проведен статистический анализ полученных результатов и сделаны выводы о качестве и применимости решений на основе LLM для создания естественно-языковых интерфейсов к базам данных.

This work presents the approach to designing and experimentally evaluating an intelligent system that converts natural language queries into SQL statements for relational databases using Large Language Models (LLMs). The main aspects of Natural Language Processing (NLP) and the capabilities of modern LLMs are examined. Both the advantages and limitations of LLM-based approaches are identified, including their ability to generalize to new query types and challenges in handling ambiguous or incomplete user requests. The architecture of the intelligent system is proposed and implemented, featuring a Node.js backend with integration of Groq/OpenAI models and a React-based user interface. The system is adapted for Russian-language queries and supports dynamic schema extraction from PostgreSQL databases. The overall performance of the system is tested, including the accuracy and speed of SQL generation for various query types. Comparative experiments are conducted with template-based and heuristic methods. Statistical analysis of the results is performed, and conclusions are drawn regarding the quality and applicability of LLM-based solutions for natural language interfaces to databases.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics