Детальная информация
| Название | Разработка программного обеспечения для автоматического формирования запросов к базе данных на основе текстового описания задачи: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем» |
|---|---|
| Авторы | Нгунга Нджоя Чарльз Эммануэль |
| Научный руководитель | Сабинин Олег Юрьевич |
| Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Выходные сведения | Санкт-Петербург, 2025 |
| Коллекция | Выпускные квалификационные работы ; Общая коллекция |
| Тематика | интеллектуальные системы ; большие языковые модели ; обработка естественного языка ; генерация sql ; машинное обучение ; базы данных ; intelligent systems ; large language models ; natural language processing ; sql generation ; machine learning ; databases |
| Тип документа | Выпускная квалификационная работа магистра |
| Тип файла | |
| Язык | Русский |
| Уровень высшего образования | Магистратура |
| Код специальности ФГОС | 02.04.03 |
| Группа специальностей ФГОС | 020000 - Компьютерные и информационные науки |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-4342 |
| Права доступа | Доступ по паролю из сети Интернет (чтение) |
| Дополнительно | Новинка |
| Ключ записи | ru\spstu\vkr\38967 |
| Дата создания записи | 24.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
В работе представлен подход к проектированию и экспериментальному исследованию интеллектуальной системы, преобразующей естественно-языковые запросы в SQL-запросы для реляционных баз данных с применением больших языковых моделей (LLM). Рассмотрены основные аспекты обработки естественного языка (NLP) и возможности современных LLM. Выделены как преимущества, так и ограничения подхода на основе LLM, включая способность к обобщению новых типов запросов и сложности при работе с неоднозначными или неполными пользовательскими формулировками. Предложена и реализована архитектура интеллектуальной системы, включающая серверную часть на Node.js с интеграцией моделей Groq/OpenAI и пользовательский интерфейс на React. Система адаптирована для работы с русскоязычными запросами и поддерживает динамическое извлечение схемы из базы данных PostgreSQL. Проведено тестирование производительности системы, включая оценку точности и скорости генерации SQL-запросов для различных типов пользовательских запросов. Выполнено сравнительное экспериментальное исследование с шаблонными и эвристическими методами. Проведен статистический анализ полученных результатов и сделаны выводы о качестве и применимости решений на основе LLM для создания естественно-языковых интерфейсов к базам данных.
This work presents the approach to designing and experimentally evaluating an intelligent system that converts natural language queries into SQL statements for relational databases using Large Language Models (LLMs). The main aspects of Natural Language Processing (NLP) and the capabilities of modern LLMs are examined. Both the advantages and limitations of LLM-based approaches are identified, including their ability to generalize to new query types and challenges in handling ambiguous or incomplete user requests. The architecture of the intelligent system is proposed and implemented, featuring a Node.js backend with integration of Groq/OpenAI models and a React-based user interface. The system is adapted for Russian-language queries and supports dynamic schema extraction from PostgreSQL databases. The overall performance of the system is tested, including the accuracy and speed of SQL generation for various query types. Comparative experiments are conducted with template-based and heuristic methods. Statistical analysis of the results is performed, and conclusions are drawn regarding the quality and applicability of LLM-based solutions for natural language interfaces to databases.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0