Детальная информация

Название: Исследование архитектуры распределенного реляционного хранилища большого объёма разнородных данных: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Высокопроизводительные облачные вычисления и программное обеспечение роботов»
Авторы: Лисенкова Анна Алексеевна
Научный руководитель: Попов Сергей Геннадьевич
Другие авторы: Голубева Ирина Эрнестовна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: кластер; шардинг; горизонтальное масштабирование; реляционные базы данных; big data; PostgreSQL; cluster; sharding; horizontal scaling; RDBMS
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 02.04.01
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-1500
Права доступа: Доступ по паролю из сети Интернет (чтение)
Ключ записи: ru\spstu\vkr\8219

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной квалификационной работы: «Исследование архитектуры распределенного реляционного хранилища большого объёма разнородных данных». При работе с базами данных больших объёмов возникает проблема длительного времени доступа к данным. Методы вертикального и горизонтального масштабирования позволяют увеличить производительность системы за счет организации кластера и распределения данных между несколькими серверами. Работа посвящена разработке и исследованию архитектуры распределенного реляционного хранилища большого объёма разнородных данных. Задачи, которые решались в ходе исследования: 1. Изучение особенностей построения распределенных хранилищ данных. 2. Выявление основных компонент, необходимых для организации кластера. 3. Исследование алгоритмов декомпозации данных. 4. Разработка архитектуры распределенного реляционного хранилища. 5. Анализ производительности построенной системы. В работе проанализированы подходы к организации распределенных реляционных и NoSQL хранилищ. В результате спроектирована архитектура распределенного хранилища на основе СУБД PostgreSQL и расширения Citus, реализован макет кластера, состоящий из двух серверов, а также проведен сравнительный анализ производительности полученной системы с одноузловым решением. Результаты могут быть использованы для построения распределенных хранилищ большого объёма разнородных данных с высокой степенью устойчивости и быстрым доступом к данным.

The subject of the graduate qualification work is “The architecture of distributed relational storage of large volume of heterogeneous data study”. When working with databases of large volumes, the problem of a long access time to the data arises. The methods of vertical and horizontal scaling can increase system performance by organizing a cluster and distributing data between multiple servers. The given work is devoted to the architecture of the distributed relational storage of large volume of heterogeneous data development and study. The research set the following goals: 1. The study of building distributed data warehouses features. 2. Identification of the main components necessary for the organization of the cluster. 3. The study of data decomposition algorithms. 4. Development of distributed relational storage architecture. 5. Analysis of the built system performance. The study resulted into analysis of the approaches to the organization of distributed relational and NoSQL repositories. As a result, the architecture of distributed storage based on the PostgreSQL DBMS and the Citus extension was designed, a cluster layout consisting of two servers was implemented, and a comparative analysis of the performance of the resulting system with a single-node solution was carried out. The results can be used to build distributed storages of a large volume of heterogeneous data with a high degree of stability and quick access to data.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 4
За последние 30 дней: 0
Подробная статистика