Details
| Title | Метод декомпозиции данных в распределённых реляционных базах данных: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
|---|---|
| Creators | Семкин Дмитрий Евгеньевич |
| Scientific adviser | Попов Сергей Геннадьевич |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | распределённая база данных ; горизонтальная декомпозиция ; балансировка нагрузки ; алгоритм ; кластеризация ; k-means ; жадная миграция ; python ; distributed database ; horizontal decomposition ; load balancing ; algorithm ; clustering ; greedy migration |
| Document type | Master graduation qualification work |
| File type | |
| Language | Russian |
| Level of education | Master |
| Speciality code (FGOS) | 02.04.01 |
| Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-4300 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\38926 |
| Record create date | 9/24/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
В работе рассматривается проблема неравномерного распределения нагрузки в распределённых реляционных базах данных (РРБД), возникающая при статическом разбиении данных на фрагменты. Статическое распределение, задаваемое на этапе проектирования, не учитывает изменения в характере пользовательских запросов и может приводить к перегрузке отдельных узлов, снижая общую производительность системы. Для решения данной проблемы разработан метод декомпозиции данных, основанный на горизонтальном фрагментировании и последующем перераспределении фрагментов с учётом текущей интенсивности запросов. Метод сочетает в себе кластеризацию k-means и жадную миграцию фрагментов между узлами, направленную на достижение баланса нагрузки по объёму передаваемых данных и числу обращений к фрагментам. В работе представлена модель задачи перераспределения фрагментов, а также реализация алгоритма на языке Python. Проведён эксперимент на четырёхузловой системе, демонстрирующий эффективность предложенного подхода. Результаты показали, что в случае значительного расхождения между изначальным статическим размещением и реальной динамикой запросов, использование предлагаемого алгоритма позволяет уменьшить среднее время выполнения запросов до 35%, по сравнению с исходной конфигурацией.
This work addresses the problem of uneven load distribution in distributed relational databases (DRDBs) that arises from static data fragmentation. Static partitioning, defined during the design phase, does not account for changes in query patterns and may lead to overloading individual nodes, reducing the overall system performance. To solve this issue, a data decomposition method has been developed based on horizontal fragmentation and subsequent redistribution of fragments according to current query intensity. The method combines k-means clustering and greedy migration of fragments between nodes to achieve load balancing with respect to both data transfer volumes and the number of fragment accesses. The work presents a formal model of the fragment redistribution problem as well as an implementation of the algorithm in Python. An experiment was conducted on a four-node system, demonstrating the effectiveness of the proposed approach. The results showed that in cases of significant deviation between initial static placement and actual query dynamics, the use of the proposed algorithm can reduce average query execution time by up to 35% compared to the original configuration.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0