Детальная информация

Название Алгоритм распределения данных в базе данных без избыточности: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение»
Авторы Климова Ольга Андреевна
Научный руководитель Попов Сергей Геннадьевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика распределенная база данных; алгоритм; метод; задача; распределение данных; фрагмент; база данных без избыточности; distributed database; algorithm; method; task; data distribution; fragment; non-redundant database
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 02.04.01
Группа специальностей ФГОС 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2024/vr/vr24-5043
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\33212
Дата создания записи 29.08.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В современных распределенных базах данных расположение данных определяется статически на этапе разработки. Ввиду динамики поступления запросов пользователей на узлы распределенной базы данных статическое распределение данных не всегда обеспечивает оптимальное расположение фрагментов по узлам, что чрезмерно нагружает ресурсы базы данных и вызывает замедление обработки запросов пользователей. Для решения данной проблемы предложен метод распределения данных в распределенной базе данных, основанный на критерии порога перераспределения. В качестве порога выбрано максимальное число обращений от внешних узлов хотя бы к одному фрагменту распределенной базы данных. Метод реализован в алгоритме отслеживания интенсивности запросов пользователей, который позволяет при увеличении числа сторонних запросов к узлам РБД осуществлять перераспределение фрагментов распределенной базы данных с учетом объемов передаваемых данных и времени, необходимого для передачи единицы данных между узлами. Исследование показало, что применение алгоритма обеспечивает оптимизацию среднего времени выполнения запросов. В случае полного несоответствия первоначального статического распределения интенсивности поступления запросов на узлы, функционирование алгоритма позволяет уменьшить среднее время выполнения запросов в системе на 35%. Алгоритм может быть применен в централизованном балансировщике нагрузки системы управления распределенными базами данных.

In modern distributed databases, the location of the data is determined statically during the design phase. Due to the dynamics of user requests arriving at distributed database nodes, static data distribution does not always ensure the optimal arrangement of fragments across nodes, which excessively loads database resources and slows down the processing of user requests. To solve this problem, a method for distributing data in a distributed database is proposed, based on the redistribution threshold criterion. The maximum number of requests from external nodes to at least one fragment of the distributed database was selected as the threshold. The method is implemented in an algorithm for tracking the intensity of user requests, which allows, as the number of third-party requests to nodes of a distributed database increases, to redistribute fragments of a distributed database, taking into account the volume of transmitted data and the time required to transfer a unit of data between nodes. The study showed that the use of the algorithm optimizes the average query execution time. In the event of a complete discrepancy between the initial static distribution of the intensity of requests arriving at nodes, the operation of the algorithm makes it possible to reduce the average time for executing requests in the system by 35%. The algorithm can be applied in a centralized load balancer of a distributed database management system.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 1 
За последние 30 дней: 1

Подробная статистика