Details

Title Разработка отказоустойчивой распределенной системы мониторинга для системы хранения данных: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_01 «Технология разработки и сопровождения качественного программного продукта»
Creators Кулаковский Владислав Игоревич
Scientific adviser Леонтьева Татьяна Владимировна
Other creators Локшина Екатерина Геннадиевна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2020
Collection Выпускные квалификационные работы; Общая коллекция
Subjects мониторинг; система мониторинга; отказоустойчивость; высокая доступность; influxdb; telegraf; grafana; monitoring; monitoring system; fault-tolerance; high-availability
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
Links Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI 10.18720/SPBPU/3/2020/vr/vr20-1392
Rights Доступ по паролю из сети Интернет (чтение)
Record key ru\spstu\vkr\7211
Record create date 7/23/2020

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Тема выпускной квалификационной работы: «Разработка отказоустойчивой распределенной системы мониторинга для системы хранения данных». Работа посвящена исследованию существующих решений для построения системы мониторинга в сложных технических системах, а также проектированию и разработке решения, обеспечивающего, надежное хранение метрик, их высокую доступность и отказоустойчивость при частичной деградации системы. Работа проводилась на основе существующего продукта. Исходное решение обеспечивало необходимые требования, но обладало крайне низкой производительностью и накладывало ограничения на количество хранимых метрических значений. С целью повышения эффективности хранения метрик и увеличения их числа, без ущерба для надежности всей системы, было спроектировано и реализовано новое решение, в основе которого лежит использование базы данных временных рядов. Для обеспечения надежности и доступности, используется стандартный подход для систем, состоящих из нескольких узлов – дублирование компонентов. Для достижения цели были разработаны инструменты, которые обеспечивают согласованность данных между несколькими экземплярами баз данных, а также позволяют получить непротиворечивые результаты запросов из всех копий БД. Результаты апробации данного решения показали высокий потенциал для дальнейшего использования в существующей системе.

The subject if the graduate work is “Development of fault-tolerant distributed monitoring system for data storage system”. The given work is devoted to the research of existing solutions for building a monitoring system for complex technical systems, as well as the design and development of a solution that provides reliable storage of metrics, high availability, and fault-tolerance at partial degradation of the system. The work was carried out based on the existing product. The original solution provided the necessary requirements but had extremely low performance and imposed restrictions on the number of stored metric values. In order to increase the storage efficiency of metrics and increase their number, without compromising the reliability of the entire system, a new solution was designed and implemented, which is based on the use of a time-series database. To ensure reliability and availability, a standard approach is used for systems consisting of several nodes - duplication of components. To achieve the goal, tools have been developed that ensure data consistency between multiple database instances and allow you to get consistent query results from all copies of the database. The results of testing this solution showed a high potential for further use in the existing system.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 22 
Last 30 days: 0

Detailed usage statistics