Автоматическое построение логической модели реляционной базы данных по словесному описанию предметной области: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем»

Жемчугова, Елена Валерьевна

Details

Title	Автоматическое построение логической модели реляционной базы данных по словесному описанию предметной области: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем»
Creators	Жемчугова Елена Валерьевна
Scientific adviser	Сабинин Олег Юрьевич
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint	Санкт-Петербург, 2025
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	реляционные базы данных ; анализ текста ; natural language processing ; named entity recognition ; relation extraction ; relational databases ; text analysis
Document type	Master graduation qualification work
File type	PDF
Language	Russian
Level of education	Master
Speciality code (FGOS)	02.04.03
Speciality group (FGOS)	020000 - Компьютерные и информационные науки
DOI	10.18720/SPBPU/3/2025/vr/vr25-4156
Rights	Доступ по паролю из сети Интернет (чтение)
Additionally	New arrival
Record key	ru\spstu\vkr\37930
Record create date	9/23/2025

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

В данной работе рассматривается методика, направленная на упрощение трудоемкого процесса формирования логических моделей баз данных, когда исходные данные представляют собой текстовые описания на естественном языке. В качестве решения предлагается разработанный прототип системы, который способен анализировать вводимый пользователем текст на русском языке и создавать на его основе структуру базы данных. В исследовании освещаются вопросы, связанные с извлечением информации из текстовых источников на естественном языке, а также рассматриваются известные подходы к решению этой задачи. Существенное внимание уделяется теории риторической структуры и практике её применения с целью автоматического выделения необходимых сведений. При разработке прототипа системы был сформирован и аннотирован корпус данных для обучения, а также созданы и обучены две нейронные модели, отвечающие за извлечение информации, требуемой для формирования логической модели базы данных. Полученный прототип успешно демонстрирует способность формировать модель на основе исходного описания на естественном языке, а также показывает неплохие результаты по сравнению с решениями, использующими крупные языковые модели (ChatGPT, DeepSeek и GigaChat).

This paper presents a methodology aimed at simplifying the labor-intensive process of creating logical database models when the source data consists of natural-language text descriptions. The proposed solution is a prototype system capable of analyzing user-entered Russian text and generating a corresponding database structure. The study addresses the challenges involved in extracting information from natural-language textual sources and reviews known approaches to solving these issues. Considerable attention is paid to rhetorical structure theory and its practical application for automatically identifying the necessary data. During the development of the system prototype, a data corpus was created and annotated for training, and two neural models were designed and trained to extract the information required for building the logical model of the database. The resulting prototype successfully demonstrates the ability to form a model based on the original natural-language description, as well as showing competitive results when compared to solutions that utilize large language models (ChatGPT, DeepSeek, and GigaChat).

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 0
Last 30 days: 0

Detailed usage statistics