Details

Title Автоматическое построение логической модели реляционной базы данных по словесному описанию предметной области: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем»
Creators Жемчугова Елена Валерьевна
Scientific adviser Сабинин Олег Юрьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects реляционные базы данных ; анализ текста ; natural language processing ; named entity recognition ; relation extraction ; relational databases ; text analysis
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 02.04.03
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2025/vr/vr25-4156
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\37930
Record create date 9/23/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

В данной работе рассматривается методика, направленная на упрощение трудоемкого процесса формирования логических моделей баз данных, когда исходные данные представляют собой текстовые описания на естественном языке. В качестве решения предлагается разработанный прототип системы, который способен анализировать вводимый пользователем текст на русском языке и создавать на его основе структуру базы данных. В исследовании освещаются вопросы, связанные с извлечением информации из текстовых источников на естественном языке, а также рассматриваются известные подходы к решению этой задачи. Существенное внимание уделяется теории риторической структуры и практике её применения с целью автоматического выделения необходимых сведений. При разработке прототипа системы был сформирован и аннотирован корпус данных для обучения, а также созданы и обучены две нейронные модели, отвечающие за извлечение информации, требуемой для формирования логической модели базы данных. Полученный прототип успешно демонстрирует способность формировать модель на основе исходного описания на естественном языке, а также показывает неплохие результаты по сравнению с решениями, использующими крупные языковые модели (ChatGPT, DeepSeek и GigaChat).

This paper presents a methodology aimed at simplifying the labor-intensive process of creating logical database models when the source data consists of natural-language text descriptions. The proposed solution is a prototype system capable of analyzing user-entered Russian text and generating a corresponding database structure. The study addresses the challenges involved in extracting information from natural-language textual sources and reviews known approaches to solving these issues. Considerable attention is paid to rhetorical structure theory and its practical application for automatically identifying the necessary data. During the development of the system prototype, a data corpus was created and annotated for training, and two neural models were designed and trained to extract the information required for building the logical model of the database. The resulting prototype successfully demonstrates the ability to form a model based on the original natural-language description, as well as showing competitive results when compared to solutions that utilize large language models (ChatGPT, DeepSeek, and GigaChat).

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics