Details
Title | Автоматическое построение логической модели реляционной базы данных по словесному описанию предметной области: выпускная квалификационная работа магистра: направление 02.04.03 «Математическое обеспечение и администрирование информационных систем» ; образовательная программа 02.04.03_01 «Разработка и математическое обеспечение интеллектуальных информационных систем» |
---|---|
Creators | Жемчугова Елена Валерьевна |
Scientific adviser | Сабинин Олег Юрьевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | реляционные базы данных ; анализ текста ; natural language processing ; named entity recognition ; relation extraction ; relational databases ; text analysis |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 02.04.03 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-4156 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37930 |
Record create date | 9/23/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
В данной работе рассматривается методика, направленная на упрощение трудоемкого процесса формирования логических моделей баз данных, когда исходные данные представляют собой текстовые описания на естественном языке. В качестве решения предлагается разработанный прототип системы, который способен анализировать вводимый пользователем текст на русском языке и создавать на его основе структуру базы данных. В исследовании освещаются вопросы, связанные с извлечением информации из текстовых источников на естественном языке, а также рассматриваются известные подходы к решению этой задачи. Существенное внимание уделяется теории риторической структуры и практике её применения с целью автоматического выделения необходимых сведений. При разработке прототипа системы был сформирован и аннотирован корпус данных для обучения, а также созданы и обучены две нейронные модели, отвечающие за извлечение информации, требуемой для формирования логической модели базы данных. Полученный прототип успешно демонстрирует способность формировать модель на основе исходного описания на естественном языке, а также показывает неплохие результаты по сравнению с решениями, использующими крупные языковые модели (ChatGPT, DeepSeek и GigaChat).
This paper presents a methodology aimed at simplifying the labor-intensive process of creating logical database models when the source data consists of natural-language text descriptions. The proposed solution is a prototype system capable of analyzing user-entered Russian text and generating a corresponding database structure. The study addresses the challenges involved in extracting information from natural-language textual sources and reviews known approaches to solving these issues. Considerable attention is paid to rhetorical structure theory and its practical application for automatically identifying the necessary data. During the development of the system prototype, a data corpus was created and annotated for training, and two neural models were designed and trained to extract the information required for building the logical model of the database. The resulting prototype successfully demonstrates the ability to form a model based on the original natural-language description, as well as showing competitive results when compared to solutions that utilize large language models (ChatGPT, DeepSeek, and GigaChat).
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0