Details
| Title | Разработка программного обеспечения для автоматического формирования запросов к базе данных на основе текстового описания задачи: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем» |
|---|---|
| Creators | Нгунга Нджоя Чарльз Эммануэль |
| Scientific adviser | Сабинин Олег Юрьевич |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | интеллектуальные системы ; большие языковые модели ; обработка естественного языка ; генерация sql ; машинное обучение ; базы данных ; intelligent systems ; large language models ; natural language processing ; sql generation ; machine learning ; databases |
| Document type | Master graduation qualification work |
| File type | |
| Language | Russian |
| Level of education | Master |
| Speciality code (FGOS) | 02.04.03 |
| Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-4342 |
| Rights | Доступ по паролю из сети Интернет (чтение) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\38967 |
| Record create date | 9/24/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
В работе представлен подход к проектированию и экспериментальному исследованию интеллектуальной системы, преобразующей естественно-языковые запросы в SQL-запросы для реляционных баз данных с применением больших языковых моделей (LLM). Рассмотрены основные аспекты обработки естественного языка (NLP) и возможности современных LLM. Выделены как преимущества, так и ограничения подхода на основе LLM, включая способность к обобщению новых типов запросов и сложности при работе с неоднозначными или неполными пользовательскими формулировками. Предложена и реализована архитектура интеллектуальной системы, включающая серверную часть на Node.js с интеграцией моделей Groq/OpenAI и пользовательский интерфейс на React. Система адаптирована для работы с русскоязычными запросами и поддерживает динамическое извлечение схемы из базы данных PostgreSQL. Проведено тестирование производительности системы, включая оценку точности и скорости генерации SQL-запросов для различных типов пользовательских запросов. Выполнено сравнительное экспериментальное исследование с шаблонными и эвристическими методами. Проведен статистический анализ полученных результатов и сделаны выводы о качестве и применимости решений на основе LLM для создания естественно-языковых интерфейсов к базам данных.
This work presents the approach to designing and experimentally evaluating an intelligent system that converts natural language queries into SQL statements for relational databases using Large Language Models (LLMs). The main aspects of Natural Language Processing (NLP) and the capabilities of modern LLMs are examined. Both the advantages and limitations of LLM-based approaches are identified, including their ability to generalize to new query types and challenges in handling ambiguous or incomplete user requests. The architecture of the intelligent system is proposed and implemented, featuring a Node.js backend with integration of Groq/OpenAI models and a React-based user interface. The system is adapted for Russian-language queries and supports dynamic schema extraction from PostgreSQL databases. The overall performance of the system is tested, including the accuracy and speed of SQL generation for various query types. Comparative experiments are conducted with template-based and heuristic methods. Statistical analysis of the results is performed, and conclusions are drawn regarding the quality and applicability of LLM-based solutions for natural language interfaces to databases.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0